You are on page 1of 20

Autor: Speed2001

Formato: Danisaur
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

Tratamiento de sonido y sincronizaciones


1.- Introducción
Desde que Cifirip nació en abril del 2002, muchas son las series que hemos
ripeado y distribuido, y muchas de ellas las que hemos montado a partir de ripeos de
DVD o capturas SATRip con audios en castellano. Todo ese trabajo nos ha permitido ir
mejorando poco a poco nuestros métodos e ir aprendiendo mejores formas de hacer
las cosas. Nuestra meta ha sido siempre lograr tener esos montajes a la mejor calidad
posible, concediendo al audio la importancia que creemos se merece, ya que por
desgracia suele ser éste poco considerado y sólo se dedican manuales detallados al
manejo del video. Ha habido bastante interés en muchos compañeros en aprender
estos métodos para poder colaborar en futuros montajes, así que con mucho gusto
intentaremos dar unas nociones sobre audio, intentando explicar técnicas sobre el
tratamiento de los mismos, su sincronización, mejora, mezclas, trucos, etc.
Que quede claro antes de nada que este manual no pretende sentar cátedra,
sino ayudar a aquellos interesados en aprender a trabajar con audio a conocer y
descubrir nuevas técnicas con las que mejorar resultados. Por eso animo a todo aquel
que quiera añadir datos y comentarios a lo expuesto en este manual (o desee corregir
o puntualizar algún tema) que lo haga sin cortarse, que toda aportación será siempre
bienvenida. Constantemente estamos aprendiendo, y nunca caeremos en el error de
creer que lo sabemos todo. Siempre agradeceré cada aportación que pueda hacer que
aprenda algo nuevo o que mejore mis técnicas. En ShareRip hay unos cuantos
artesanos a los que les gusta trabajar el audio (y lo hacen muy muy bien), y gracias a
ese trabajo en común mejoramos todos y disfrutamos de montajes cada vez mejores.
;-)

2.- Calidad de la fuente de audio


Empecemos primeramente por lo más básico y lo que más cuesta entender a
muchos: la calidad a la que vamos a trabajar depende en gran manera del material
que tenemos para ello, pero también de los procesos que sigamos con ese material.
Antes de ponernos a trabajar con una serie-película-documental-loquesea, debemos
asegurarnos de que contamos con el mejor material que podemos conseguir. Para que
me entendáis: nadie se va a currar unas imágenes VHSRip si existen unos DVDRip
que poder utilizar, ¿verdad? Pues en audio lo mismo. Vamos a hacer un pequeño
listado por orden de calidades:

1. Sonido DVD
2. Sonido estéreo captura (digital-TV-VHS)
3. Sonido mono captura (digital-TV-VHS)

¿Quiere decir esto que podemos clasificar el audio en tres niveles de calidad?
Pues NO. Podemos obtener capturas estéreo VHS a una calidad superior a una mala
captura de DVD, y también podemos obtener mezclas de distintas fuentes con una
calidad resultante muy similar e incluso superior a la mejor calidad DVD (ya lo iremos
viendo más adelante). Tampoco todas las capturas digitales tienen por qué ser de alta
calidad (he escuchado algunas realmente penosas) ni todas los magnetoscopios VHS

Página 2 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

graban y reproducen con la misma calidad. También influye mucho cómo se realizan
las capturas, ya nos dedicaremos a ese tema más adelante.
Es MUY importante tener en cuenta los bitrates y los samplerates (frecuencias
de muestreo) a la hora de trabajar. No va a darnos la misma calidad 128 kbps (que ni
siquiera es un estéreo real) y menos si encima es VBR (con bitrate variable) que 160 ó
192 kbps a bitrate constante (CBR). De igual forma no vamos a obtener la misma
calidad con un sample rate de 44.100 Hz que con uno de 48.000 Hz.
Un error muy común en el que se cae hoy en día: el formato ogg NO ocupa
menos que el mp3 con mejor calidad, simplemente ocupa menos, pero con menos
calidad. Los ogg a 92 kbps que se están utilizando son una verdadera castaña en
cuanto a sonido, y no están muy lejos de un vulgar mp3 a 92 kbps. ¿Suficiente para
los nada exigentes oídos de algunos? De acuerdo, pero no estamos tratando de ese
tipo de exigencias precisamente. ;-)
Tenemos que pensar que 10-15 Mb en un episodio de 45 minutos no afectan de
forma visible al resultado del episodio en cuanto a imagen (son mucho más
importantes algunos parámetros del ripeo o el número de pasadas optimizadas que el
número de Mb), mientras que esos 10-15 Mb aplicados al sonido resultan en un
tremendo incremento de la calidad del mismo. A ver si dejamos de una maldita vez de
sacrificar calidad de los audios, sobre todo de manera tan inútil.
A la hora de empezar pues un trabajo tenemos que tener en cuenta lo siguiente:

1. ¿Tenemos la mejor fuente de audio doblado que podemos conseguir?


2. ¿Tenemos la mejor fuente de audio VO que podemos conseguir?

Si en verdad la respuesta a ambas preguntas es afirmativa entonces podemos


ponernos manos a la obra, pero si obviamos cualquiera de ellas estamos caminando
hacia un resultado mucho peor del que podríamos obtener si hiciéramos las cosas
bien. Un doblaje de baja calidad lo podemos mejorar muchísimo utilizando el sonido
VO, y un doblaje de buena calidad lo podemos resaltar sobremanera mezclándolo con
el audio VO. Y si alguien duda esto, en Cifirip y Misteryrip hay sobradas pruebas de
ello, no os fiéis de mi palabra, simplemente dejad que vuestros oídos lo comprueben.
Resumiendo, para terminar esta primera parte sobre calidades: la calidad es muy
importante, y en audio unos pocos Mb son decisivos para obtenerla. Antes de
ponernos a trabajar busquemos las mejores fuentes de audio, tanto doblado como
original. Trabajar con lo primero que se pille es algo demasiado común por desgracia y
sólo conduce a resultados mediocres claramente superables.

3.- Capturas de audio


El tema de las capturas es algo sorprendentemente sencillo y sin embargo uno
de los procesos más desconocidos por la mayoría, en gran medida el desconocimiento
viene por relacionar capturas de audio con capturas de video, cuando en realidad son
dos procesos totalmente independientes. Para capturar video necesitamos una tarjeta
capturadora específica, para capturar audio simplemente una tarjeta de sonido vulgar
y corriente (¿quien no la tiene hoy en día?). ;-)
De la fuente de ese audio (magnetoscopio VHS, TV, radio a pilas, sintonizador
de UHF, cámara digital, magnetófono con micrófono, etc..) sólo tenemos que llevar un
cable a la entrada (Line IN) de la tarjeta de sonido. Para los que la tengáis con
colorines suele ser la azul, no confundir con la rosa que es la del micrófono y tiene una

Página 3 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

impedancia muy diferente, por lo que no debéis usarla salvo que la única forma de
grabar algo sea a golpe de micrófono X-D).
Evidentemente el tema del cable es importante por muchas razones:

Ø Si no está convenientemente apantallado tendréis ruidos y parásitos


Ø Para obtener una captura en estéreo debéis usar el cable adecuado, y por
supuesto que la fuente del sonido sea estéreo.
Ø Si el cable es demasiado largo podéis tener pérdidas de señal y algún que otro
ruido (normalmente por encima de 10 metros)
Ø Si las conexiones tienen holgura se os puede meter mucho ruido en la
grabación

Una vez que tenemos el tema del cableado solucionado vamos con la siguiente
parte importante, que es la del software. En vuestras propiedades de audio abrid los
controles de grabación, seleccionad la entrada de línea (exclusivamente) y dejadlo a
mano para poder controlar el nivel de entrada de la señal. A continuación necesitaréis
un programa que os permita grabar en HD el sonido que vayáis a obtener. Mi
recomendación particular es el Soundforge , aunque existen muchos programas
válidos para grabar sonido.
Lo más importante a la hora de capturar es "preparar" adecuadamente lo que va
a ser dicha captura en lo que respecta a dos parámetros: formato y niveles.
El formato lo seleccionamos inicialmente cuando vamos a abrir lo que va a ser la
captura, en Soundforge se llaman recording attributes. Debemos fijar 16 bits estéreo y
una frecuencia de muestreo (sample rate) de 48.000 Hz. Podemos seleccionar 24 o
incluso 32 bits, pero no siempre obtendremos una mejora sustancial en la calidad y,
además, si vamos justitos de espacio en HD y memoria RAM tenemos que pensar que
una captura 32 bits de 45 minutos nos va a ocupar mas de 1 Gb. Mi consejo es que
probéis a hacer capturas cortas de varios segundos a 16 y a 24 bits, que elijáis la que
mejor resultado os proporcione, y que a igualdad de resultado os quedéis con la de 16
bits.
Los niveles es cuestión de controlar que los indicadores de nivel de grabación
(se llaman VU-meters) no alcancen el rojo, lo que indicaría saturación de la señal.
Tened cuidado de no grabar a demasiado volumen para evitar esos picos de
saturación, pero también de no grabar demasiado bajo, porque entonces tendríais que
amplificar posteriormente la señal, y eso haría que amplificarais también los ruidos de
fondo. Como todo en la vida, el mejor nivel es aquel que está en su justa medida.
Una vez que hayáis terminado la grabación tendréis en pantalla la onda
resultante de lo que habéis grabado. Si vamos a trabajar nosotros mismos con este
audio entonces lo mejor es guardarlo en formato wav (PCM / 48KHz). Esto nos
ocupará entre 400 y 500 Mb para un episodio de 45 minutos (algo más de 1 Gb para
un largometraje) pero nos garantiza que estamos conservando el audio "tal cual", sin
realizar ningún tipo de compresión que nos pueda hacer perder calidad.
Si necesitáis comprimir el audio para poder enviárselo a alguien para que trabaje
con él os sugiero convertirlo a un bitrate alto, mínimo 192 kbps, con bitrate constante y
asegurándoos de que conserváis el sample rate de 48 KHz. En el Soundforge tenéis
que tener cuidado con esto porque a nada que os descuidéis os guarda el mp3 a 44,1
KHz. Para evitarlo no os fiéis nunca de los Templates (plantillas), seleccionad Custom
(personalizar) en la pantalla de guardar y una vez hayáis seleccionado mp3,
aseguraos de fijar la configuración deseada. Os pongo una tabla aproximada de
tamaños para un episodio de 42’:

Página 4 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

Ø 128 Kbps ? 38,3 Mb


Ø 160 Kbps ? 47,8 Mb
Ø 192 Kbps ? 57,4 Mb
Ø 224 Kbps ? 66,9 Mb
Ø 256 Kbps ? 76,5 Mb
Ø 320 Kbps ? 95,6 Mb

Aprovechando esto, fijaos en la poca diferencia de tamaño que supone mejorar


la calidad de un audio. Esos 9 ó 10 Mb no se notan en absoluto en la calidad de un
video de 42’ y sin embargo aumentan dramáticamente la calidad del sonido. A ver si
empezamos a darle al audio los Mb que se merece y desterramos los 128 Kbps y
bitrates inferiores para siempre. ;-)
Resumiendo: capturar audio es sencillo (como todo) y cuestión de práctica
(como todo). No os desmoralicéis si no obtenéis buenos resultados con las primeras
grabaciones, seguid haciendo pruebas hasta que vayáis depurando el método. Para
esto (como para todo lo relacionado con el audio :-D), vuestro oído es la mejor
herramienta.

4.- Sincronización (1ª parte)


Empezaremos por aclarar unos cuantos puntos sobre los que hay bastante
confusión:

Ø Sincronizar es una fase más del proceso de tratamiento del audio, hacer sólo
la sincronización y nada más es dejar las cosas a medias.
Ø La sincronización se hace sobre la banda de audio, no debéis modificar la
banda de video salvo, de ser necesario, para tema de frame rates (tema que
ya veremos)
Ø Sincronizar bien lleva tiempo y por tanto requiere paciencia. Si eres de los que
no piensa dedicar más de 15 o 30 minutos a ello mejor no sigas leyendo.
Ø No utilicéis programas de juguete. Al igual que no usaríais el Paintbrush para
retoque fotográfico, no utilicéis el Synchronizer ni otras "pseudo-herramientas".
Se trata de hacer las cosas bien, no de chapuzas.

Y ahora razonemos un poco el asunto: se trata de ajustar una banda de sonido a


una imagen que ya cuenta con su banda de audio original. Lo lógico es que limpiemos
esa banda de audio que queremos adaptar, eliminando todo aquello que sobre
(anuncios, pausas, fundidos, etc.), completemos aquellas partes que faltan y la
vayamos adaptando para que encaje de la mejor forma posible con ese video. Ir
cortando el video en trozos para pegarle a su vez trozos de audio que vamos
desplazando adelante y atrás (a ojo, por cierto) hasta que nos parezca que encajen y
así y una y otra vez no deja de ser el equivalente a una masacre. Masacre cuyo
resultado es una mala sincronización, una secuencia de video mutilada en trozos y
una secuencia de audio en cachos que además están desplazados. Probad a
reproducir el resultado en distintos reproductores de video y veréis que cada uno
ofrece un resultado diferente, eso sin contar con que varias partes de la acción estarán
bastante desincronizadas. Probad a separar el audio (si es que podéis extraerlo en un
solo trozo) y a volverlo a unir al video y veréis cómo se ha desplazado todo de nuevo.

Página 5 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

La sincronización lógica ha de hacerse modificando la banda de audio, y con


ello no solo lograremos ajustar la sincronía completa al milisegundo, sino que además
nos permite hacer muchas más cosas y solucionar muchas mas carencias del audio,
como iremos viendo poco a poco. El mejor programa que podemos usar para
sincronizar es el Cooledit, gracias a su posibilidad de edición en multicanal. ¿Qué
significa esto de multicanal? Pues que podemos cargar, mezclar y reproducir de forma
simultánea varias ondas con el fin de compararlas, sumarlas, restarlas, o lo que
necesitemos. Esto nos va a permitir muchísimas cosas que nos van a ayudar (y que
iremos viendo cómo hacer): desde sincronizar a partir del audio VO hasta aprovechar
ese audio VO para compensar, mejorar y/o completar el audio doblado.
El Cooledit permite trabajar sólo con el audio sin comprimir, es decir, en
formato wav. Podéis utilizar el Soundforge para pasar de mp3 a wav, o el Ac3Tool
para convertir un AC3, ya hablaremos en mas profundidad de formatos cuando
lleguemos a la parte relativa a como aprovechar y mezclar la VO con el doblaje.
Un apunte más antes de seguir: en este manual no vamos a tratar del manejo de
programas, sino de metodología a seguir. Se sobreentiende que si alguien quiere
seguir esta metodología tendrá que aprender a manejar dichos programas, para los
cuales ya existen instrucciones y/o manuales. Así pues, no pretendemos enseñar a
manejar el Cooledit ni el Soundforge ni ningún otro programa de los que utilicemos,
simplemente indicamos cuándo los usamos y cómo los usamos. Aprender a
manejarlos correctamente para sacarles el partido adecuado ya es tarea exterior a
este manual (que ya ocupa bastante de por sí X-DDD).
Sigamos con nuestro proceso lógico: ¿cual es la mejor referencia que podemos
tener para poder sincronizar? La respuesta es obvia: la banda de audio original. Así
pues, si con el Cooledit en modo Multitrack (pulsad F12 para conmutar el modo
Multitrack con el modo Single Track) abrimos en la Pista 1 la banda de audio VO (la
cual evidentemente está perfectamente sincronizada con el video) y en la Pista 2 la
banda de audio doblada que queremos sincronizar, podemos ir ajustando la Pista 2
basándonos en la Pista 1 comparándolas segundo a segundo. Y si contamos con más
bandas de audio que queremos o podemos utilizar, podemos irlas abriendo en las
siguientes pistas y más adelante elegir cómo queremos mezclaralas entre sí para
obtener un audio definitivo. Tranquilos que ya iremos viendo todo esto más en
profundidad.
Antes de seguir, es muy importante ver la conveniencia de tener ambas bandas
de audio homogéneas. Si necesitamos un trozo de audio que nos falte podemos
cogerlo del audio VO, o incluso sustituir aquellas partes que sean solo música y
efectos (como las entradillas y los títulos de crédito). Digamos para entendernos que
es como tener dos puzzles, utilizamos uno para componer el otro y cuando nos falta
una pieza del segundo (o está rota o defectuosa) la tomamos del primero y la
duplicamos para poder completar el segundo. Para poder hacer todo eso, necesitamos
que las bandas de audio sean compatibles entre si y que además los niveles de
volumen sean lo mas similares posible. Para poder utilizar trozos de un audio sobre
otro es necesario que ambos tengan el mismo sample rate, y aunque como
comentamos en el apartado 2 es mejor trabajar a 48K que a 44,1K, en este caso
tendremos que adaptarnos al sample rate de la VO. Podemos variar el sample rate
con el Cooledit, pero según mi experiencia ha sido siempre más eficaz para estos
menesteres el Soundforge , no os importe que sea un poco más lento si es más
seguro. ;-)
Lo abrimos con el Soundforge, lo convertimos a wav si es que no lo estaba ya y
utilizamos la función Resample (Process->Resample). Este proceso incrementa el
nivel de muestreo interpolando datos extra y por tanto aumenta el tamaño del archivo
(en el caso de pasar de 44,1K a 48K), pero no afecta para nada al pitch del audio

Página 6 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

original. Aseguraos de NO tener activa la casilla “set the sample rate only" porque eso
sí que cambiaría el pitch timing de todo el fichero. Por esa razón adaptamos el sample
rate del doblaje a aquel que tenga la banda de audio VO, porque no podríamos utilizar
la VO como referencia para la sincronización si esta se hubiese desincronizado al
resamplear.
Un consejo extra es que inmediatamente después de hacer un resampling
guardéis el fichero en formato wav y lo volváis a abrir antes de hacer ninguna otra
operación con él. Todo programa tiene sus tonterías y el Soundforge no va a ser
menos. :-D
Ya tenemos nuestras dos bandas de audio (VO y doblaje) cargadas en las pistas
1 y 2 del Cooledit, a la misma frecuencia de muestreo y homogeneizadas en cuanto a
niveles (utilizad la función Transform -> Amplitude -> Amplify) con valores positivos o
negativos según queráis subir o atenuar el audio. Ahora comienza un proceso lento de
ir verificando uno y otro audio e ir compensando los desajustes de la Pista 2
basándonos en la Pista 1. No os desaniméis si no sabéis inglés (o el idioma que sea la
VO), que podéis (y de hecho debéis) utilizar las referencias de música y efectos para
sincronizar, ya que observaréis que en los doblajes se relajan bastante en cuanto a
sincronía en aquellas escenas en o l s que no se ven los labios del que habla. Si
además no contáis con la VO sino con un doblaje en otro idioma, entonces no os fiéis
en absoluto de la sincronía en cuanto a voces se refiere, ya que por experiencia os
digo que en otros países se dobla bastante deficientemente (o mejor dicho, sin
demasiado cuidado).
Utilizad golpes, pasos, puertas que se cierran, etc. para ir encajando ambos
audios. Tened cuidado de no modificar el audio VO ya que es el de referencia, y si lo
modificáis sin querer estáis invalidando esa referencia. Una vez cojáis experiencia y
práctica con el método veréis que no necesitáis ver en ningún momento la imagen
para lograr una sincronización perfecta. De todas formas y hasta que os vayáis
acostumbrando al método, podéis ir visualizando los resultados conforme avanzáis.
Salváis el wav y con el Virtualdub o el Nandub montáis el video incorporando ese
wav (Audio -> Wav audio), así podéis seguir con la vista lo que habéis hecho antes
con el oído. Yo, salvo casos muy específicos de audios con ciertas complicaciones o
con grandes espacios de tiempo sin poder utilizar una sola referencia de encaje,
prácticamente nunca veo la imagen hasta que he terminado por completo de
sincronizar, ecualizar y mezclar un episodio.
Por norma general, un desfase de 100 milisegundos (ms) o más es claramente
visible por cualquiera (aunque viendo algunas sincros por ahí sueltas, creo que hay
algunos que consideran que todo lo que no pase de un par de segundos es
aceptable), la cosa puede bajar hasta 50-60 ms para ojos más acostumbrados a fijarse
en la calidad de la sincronización. Por debajo de ese tiempo, el ojo no distingue el
desfase, pero el oído sí. Tomemos por ejemplo un golpe en una mesa, si ambas
bandas de audio están perfectamente sincronizadas oiremos un sólo golpe al
reproducirlas, pero si existe un desfase de 50 ms entre ellas, sonará un golpe doble
que podrá ir desde un eco hasta dos golpes separados en función de lo grande que
sea el desfase. Por esta razón no debéis nunca fiaros de la vista imagen-sonido a la
hora de sincronizar, sino de la "imagen” de esas ondas en la pantalla multicanal de
vuestro Cooledit. ;-)
Personalmente me concedo desfases máximos de 10 ms, aunque a veces
puedan escapárseme trozos de 15 ó 20. Este nivel de exigencia ha de ser tomado muy
en serio y a rajatabla, no solo por perfeccionar la sincronización, sino porque
necesitamos la máxima exactitud posible si queremos mezclar posteriormente audio
VO y audio doblado para mejorar la calidad (proceso que ya estudiaremos más
adelante). Tampoco hay que fiarse de aquello que "parezca" que está sincronizado,

Página 7 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

los técnicos de sonido de doblaje recurren a muchas argucias para encajar esos
doblajes, y en ocasiones tenemos desfases positivos en un minuto que pueden pasar
a negativos al minuto siguiente y volver a cambiar unos pocos segundos después.
Esto obliga a repasarse todo el audio de forma minuciosa comprobando que la
sincronización se mantiene. Todo esto requiere mucho tiempo y paciencia, pero ya
avisamos de que estos métodos no son para comodones, y el que algo quiere algo le
cuesta. ;-)
Dejamos para la siguiente sección otros detalles sobre sincronización, sobre
todo qué hacer en aquellos casos en los que ambas bandas de audio difieren en
tamaño, cómo compensar el problema de los diferentes frame-rates, etc. También
hablaremos en posteriores apartados sobre cómo mejorar la calidad de los audios,
filtrar ruidos, etc.

5.- Sincronización (2ª parte)


Hasta ahora hemos visto la parte teórica de como emprender una sincronización
cuando las cosas más o menos encajan. Empecemos a ir tratando aquellos casos
problemáticos, en los que vemos que la banda de audio original y la doblada no
coinciden ni aunque las intentemos pegar con superglue. Existen dos razones por las
cuales esto puede suceder, veámoslas por separado:

Caso 1: Los frame rates no coinciden


Por norma general, en Europa utilizamos un formato normalizado de 25 fps
(Frames per second = Fotogramas por segundo), mientras que en USA tienen 2
formatos diferentes para cine y TV, que son 23,976 y 29,97 fps. Generalmente, cuando
las películas se exportan a Europa se convierten los formatos para adaptarlos a la
norma europea y por ello los doblajes se encuentran hechos a esa velocidad de 25
fps, mientras que las VO mantienen la velocidad original. Por esa razón, cuando
intentamos unir un doblaje (hecho a 25 fps) con la imagen que conserva un frame rate
diferente vemos que no coincide. Así pues, hay que convertir alguno.
¿Qué hacer? Aquellos que sólo utilizan la banda de audio doblada lo tienen fácil,
simplemente cambian el frame rate del video a 25 con el Virtualdub y santas pascuas.
Pero ya vimos en la parte anterior la conveniencia de utilizar la VO, no sólo para
sincronizar correctamente, sino también para utilizarla mejorando la calidad de la
banda doblada (aspecto que ya veremos de forma extensa en los próximos
apartados). No seamos pues tan vaguetes y vamos a currar un poco con esas bandas,
que el resultado merecerá la pena.
Veamos. Tenemos por un lado una imagen y un audio original a 29,97 y un
doblaje a 25 fps, dos opciones. La pregunta del millón es: ¿cuál convertimos? La
cuestión primordial es la siguiente: por mucho que queramos aprovechar el audio VO,
el que nos va a mandar es el audio doblado que es el que realmente queremos que se
escuche, por lo que tenemos que decidir si pasar ese audio a 29,97 no nos va a
"apitufar" demasiado las voces (al pasar a un frame rate superior, el sonido
lógicamente se acelerará). Parece evidente que si de la VO solo vamos a aprovechar
música y efectos, en estos se note mucho menos una disminución de la velocidad.
Esto no debe ser aplicado como norma general, sino que cada caso requiere su
estudio, pero lo habitual es adaptar la velocidad del video a la velocidad del audio
doblado.
Así pues, el video lo pasamos a 25 fps con el Virtualdub, pero con el audio VO
tenemos que hacer otro tipo de operaciones para que nos siga valiendo. Para ello lo

Página 8 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

mejor es recurrir a la ley de proporción, y el cociente entre 29,97 y 25 nos da un factor


de corrección de 1'1988. Pongamos por ejemplo una película cuya duración VO es
de 1h 34 min. 43 seg. (5683 segundos), multiplicamos por 1,1988 y obtenemos
6812,78 segundos, que son exactamente 1h 53 min. 32 seg. 780 ms. Es decir,
tenemos que hacer que esa banda de audio VO pase a durar exactamente ese
tiempo.
Para ello, tanto el Cooledit como el Soundforge tienen sus herramientas
propias. Personalmente, yo vuelvo a recurrir a mi viejo amigo el Soundforge que,
aunque más lentorro para estas cosas, es muchísimo más fiable y preciso que nuestro
común amigo el Cooledit, el cual es impagable para sincronizar y otras hierbas pero
se vuelve algo majara con estas operaciones. La opción que tenemos que utilizar está
en Process->Time Stretch. Es importante que lo hagamos sobre la onda en formato
wav, ya que aunque el Soundforge permite trabajar directamente sobre mp3 y otros
formatos, realizar la operación de reajuste de tiempo sobre formatos comprimidos te
dará errores de por lo menos 2 ó 3 segundos en el proceso, algo totalmente
inadmisible pues perderíamos la sincronización correcta. Poned la cantidad exacta de
tiempo que queréis que pase a tener el audio (incluid los milisegundos, que el
programa vea que hiláis fino X-D) y tras un ratejo de espera ya tenéis el audio
reajustado al nuevo timing, con un ligero error de unos pocos milisegundos, fácilmente
corregibles al sincronizar, y que sobre hora y media es una buena precisión y un
bajísimo margen de error.
Volved a insertarlo sobre el video reconvertido a 25 fps y tenéis que ver que la
sincronizac ión sigue siendo perfecta, si no fuera así es que os habríais equivocado en
alguna parte del proceso, revisad los pasos. El mismo procedimiento habría que seguir
si decidiéramos pasar el audio doblado a la velocidad original de la imagen,
simplemente aplicar el factor de corrección que corresponda. Aquí os dejo una tablita
para ayudaros:
BAJAR FRAME RATE:
Ø Pasar de 29,97 a 25 -> 1'1988
Ø Pasar de 25 a 23,976 -> 1'0427
Ø Pasar de 29,97 a 23,976 -> 1'25

SUBIR FRAME RATE:


Ø Pasar de 23,976 a 29,97 -> 0'8
Ø Pasar de 23,976 a 25 -> 0'95904
Ø Pasar de 25 a 29,97 -> 0'83417

Tras haber realizado correctamente todo los pasos, tenéis por fin dos bandas de
audio y una de video normalizadas todas a una misma velocidad, ya podéis realizar
tranquilamente los todos procedimientos de sincronización y mezcla sobre ellas.

Caso 2: Los frame rates son aparentemente iguales pero los audios no
coinciden
Esto es algo muy común cuando se extrae audio de un magnetoscopio VHS, ya
que los motores de arrastre a veces van más deprisa o más despacio según el aparato
y la cinta. También podemos encontrarnos chapucillas sobre ripeos de imagen, en los
que el ripeador ha variado el frame rate para apañar algún desajuste o vaya usted a
saber, y así podemos encontrarnos frame rates tan variopintos como 26'34, 25'09,
28'743, o por lo general cualquier número decimal comprendido entre 21 y 30. Estos
casos son por suerte muy poco normales y mi consejo es que intentéis trabajar al valor
normalizado de 25 fps en la medida de lo posible. Evitaréis problemas de

Página 9 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

compatibilidad y reproducción, y los ávidos pasadores a VCD de todo lo que se mueve


os lo agradecerán. ;-)
En este caso concreto, estamos hablando de aquellas desincronías progresivas
que se producen de forma constante a lo largo de una película. Si hacemos coincidir el
principio, la desincronía se va haciendo cada vez mayor y si hacemos coincidir en
mitad de la grabación se nos van principio y final, toda una pesadilla, eh?
Como ya dije, normalmente estas desincronías progresivas se deben
normalmente a un defecto en la captura de los audios. También los resampleados
conducen en ocasiones a este tipo de cambios, aunque en su caso son muy poco
acusados (unos pocos segundos en hora y media). Corregir esto es bastante sencillo,
lo más complicado es determinar con exactitud la desviación a corregir.
Veamos: El caso más habitual es tener un audio capturado de una emisión en
TV, lo que implica que dicho audio tiene cortes publicitarios, fundidos, saltos,
fotogramas perdidos y otras sorpresas que no descubriremos hasta que no vayamos
comparando con el audio VO. Es por tanto prácticamente imposible calcular con la
exactitud requerida qué cantidad de tiempo necesitamos añadir o quitar para que la
banda de audio encaje, a no ser que fuéramos revisándola segundo a segundo en
busca de esos cortes y calculando cronómetro en mano comparándola con la VO... Un
trabajo de chinos y no estamos metiendo el audio en chino, así que busquemos otra
forma.
El mejor método que he encontrado hasta la fecha es el de la extrapolación,
consiste en buscar dos referencias auditivas claramente destacables y separadas
entre sí por la mayor cantidad de tiempo posible sin que exista ningún tipo de corte ni
salto entre medias. Medimos el tiempo entre ellas en la VO, medimos el tiempo entre
esas mismas referencias en el doblaje y anotamos la diferencia. Dicha diferencia
dividida entre la longitud del fragmento es la corrección que hay que aplicar al audio
completo para ajustarlo. Veámoslo mejor con un ejemplo:
1. Cogemos una puerta que se cierra en el instante 12:28.645 en la VO.
Buscamos el mismo sonido en la doblada y lo encontramos en 12:32.540.
2. La siguiente referencia seleccionada la tenemos en 20:34:750 en la VO, lo
que hace una duración de 8 minutos, 6 segundos y 105 milisegundos para el
fragmento de audio seleccionado.
3. En el audio doblado, si el timing fuese exacto al del audio VO, por lógica la
segunda referencia debería aparecer en el instante 20:38.645, y sin embargo
vemos que no aparece hasta 20:39.850, lo que implica que la duración de
ese fragmento en el audio doblado es de 8 minutos, 7 segundos y 310
milisegundos, es decir, 1'205 segundos de desviación (más lento) para dicho
periodo de tiempo.

Por lógica la cosa nos conduce a una sencilla regla de tres: si en 487,310
segundos se ha producido una desviación de 1'205 segundos, ¿que desviación habría
que calcular para el total de la película? Pasamos a segundos el total de la
duración de la banda de audio, calculamos la fórmula y eso nos da un factor de
corrección resultante. Dicho factor lo aplicamos al audio doblado y obtenemos la
duración que debe tener el mismo, recurrimos de nuevo a la función "time stretch" de
nuestro Soundforge y ya tenemos por fin el audio ajustado a su velocidad adecuada.
Seguimos con el ejemplo anterior: suponiendo que la banda de audio doblada
dure 42' 15" 120 ms, eso hace un total de 2535,120 segundos. Multiplicamos 2535,12
por 1'205 y lo dividimos por 487,310 y el resultado nos da 6,269 segundos. Así pues,
esos son los segundos de variación que tenemos que aplicarle al audio doblado, en
nuestro caso y, dado que el doblaje iba mas lento que la VO, tenemos que descontarle

Página 10 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

6,269 segundos al audio doblado para que encaje con el VO, por lo que al hacer
un stretching el valor a buscar será de 2528,851, que traducido a minutos son 42' 08"
851 ms. Ese es el valor al que tenemos que reducir nuestro desincronizado y rebelde
audio.
Evidentemente este método de extrapolación es bastante útil, pero no
exacto al 100%. Es bueno recurrir a dos o más tomas diferentes para verificar que el
factor de corrección a aplicar es el correcto, cuantas más tomas hagamos mejor
podremos calcular dicho factor, y por tanto más exacto será el método. Pensad
que aunque al final no tengamos un audio sincronizado a la perfección, al menos lo
tendremos bastante más aproximado al tamaño que debe tener, por lo que nos será
mucho más fácil ajustar las pequeñas desviaciones de forma manual, ya que
estaremos hablando de unos pocos milisegundos cada varios minutos.
No os fiéis de los valores obtenidos para intentar corregir los desajustes de
velocidad de un magnetoscopio (vulgo video), ya que en estos depende mucho de
factores como el tamaño y tensión de la cinta, si está al principio o al final de la misma,
e incluso de la temperatura de la misma. Si un reproductor de video falla en su control
de velocidad, te dará velocidades diferentes para cada caso así que no podrás realizar
una extrapolación única sino que tendrás que afinar cada vez con los cálculos. Así que
o cambias de magnetoscopio o te armas de paciencia. ;-)

6.- Sincronización (3ª parte)


Tras haber visto cómo debemos encarar las sincronizaciones y cómo solucionar
las grandes desviaciones, dedicamos esta tercera y última parte sobre sincros (que no
del manual, ya que aun nos faltan más partes) a unos cuantos pequeños trucos útiles
y a cómo solucionar algunos de los contratiempos más habituales. Vamos a analizar
cómo resolver algunos casos particulares que os podéis encontrar frecuentemente:
• FALTA UN TROZO DEL AUDIO DOBLADO (O BIEN HAY UN TROZO SIN
DOBLAR)
Si la parte que os falta no contiene diálogos entonces no lo dudéis, recurrid a la
VO que os quedará un apaño de primera calidad. Si por el contrario la parte que os
falta lleva diálogos (según la Ley de Murphy eso se cumplirá siempre X-D), lo primero
que hay que intentar evidentemente es localizar otro audio de "repuesto" del que poder
tomar ese trozo, aunque sea a inferior calidad, y si son varios mejor que mejor (ya que
así podemos compensar algo las pérdidas de calidad). Si no tenemos forma humana
de conseguir esos "repuestos" entonces tendremos que intentar sacar todo el partido
que podamos a la VO. De una u otra forma lo podremos solventar, pero nunca dejéis
esa parte en blanco, o peor aún recortéis el video para eliminar ese trozo.
Para completar esa parte que os falta mi consejo es que no os preocupéis de
andar cortando y pegando, requiere mucho más trabajo y precisión, y es mucho más
complicado rectificar si algo no os gusta cómo queda. Dejad la parte que os falta en
silencio y recurrid a la opción multipista (multitrack) del Cooledit abriendo tantas pistas
nuevas como audios tengamos a insertar. Eso nos permitirá hacer transiciones mucho
más elaboradas, poder mezclar diferentes fuentes de audio y ajustar perfectamente los
niveles. Hablaremos de forma más extendida sobre mezclas, transiciones, ajustes,
niveles y todo esto cuando nos dediquemos al tema de mezclas más adelante.
• ES IMPOSIBLE LOCALIZAR REFERENCIAS EN UN FRAGMENTO LARGO
Ocurre a veces que nos tiramos bastantes minutos sin poder encontrar un solo
sonido o cambio musical que nos permita emparejar el doblaje con la VO, por lo que
podemos estar perdiendo sincronía durante bastante tiempo sin que nos demos
cuenta. Evidentemente la forma fácil de solucionarlo es meter un tajo (o insertar un

Página 11 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

trozo, según se necesite) para ajustar dicho desfase en el lugar que nos sea más
conveniente, pero esto no arregla el desfase durante todo ese tiempo (que seguirá
desincronizado), provocará un salto en el audio (salvo que hagamos el típico truco de
utilizar el fundido a negro más cercano) y además es una soberana chapuza.
Si nos ocurre esto y queremos hacerlo bien, no nos queda más remedio que
recurrir a la ayuda de la imagen, aunque sin fiarnos demasiado de nuestro ojo que ya
vimos que no es tan preciso com o nuestro oído. Miremos la película y veamos en qué
momentos de diálogo se pueden ver los labios del que habla, comprobemos esos
momentos de forma que el audio doblado coincida al máximo posible con el VO y
verifiquemos lo mismo en diferentes escenas separadas al menos 30 segundos unas
de otras. Es importante fijarse en los principios y finales de frase, ya que el mismo
efecto de desincronía produce ver que la voz comienza antes o después que el
movimiento de labios, como ver que dicho movimiento termina antes de que la voz
acabe, o continúa aunque la voz haya terminado. Nunca os fijéis como referencia en
aquellas voces que pertenezcan a actores fuera de cuadro o de espaldas, ya que los
actores de doblaje solo afinan con el movimiento de labios. Si éstos no se ven, las
voces pueden desfasarse con respecto a las VO hasta más de un segundo, por lo que
no sirven para efectos de sincronía.
Si lo hacéis siguiendo estas reglas veréis que afináis la sincronización al
milisegundo sin necesidad de quemaros las pestañas viendo una y otra vez la misma
secuencia. Para comprobar vuestro progreso salvad de vez en cuando la onda,
insertádsela al video con el Virtualdub y veis cómo os está quedando la cosa,
aunque, como ya os comenté, conforme vayáis pillando práctica no necesitaréis
recurrir a la imagen prácticamente nunca.
Fijaos en un curioso hecho: mirar atentamente algo, concentrarse con la vista en
detalles, produce cansancio y hasta dolor de cabeza. Escuchar atentamente sin
embargo es mucho más relajante y se puede hacer durante bastante tiempo sin sentir
tanto cansancio (salvo que escuches atentamente un martillo neumático, un tablao
flamenco taconeando a toda pastilla o a un político soltándose un discurso X-D).
• HAY SATURACIONES, INTERFERENCIAS O RUIDOS
En otra parte hablaremos sobre filtrado, ecualizado y corrección de ondas, por lo
que ya trataremos el tema en su momento. Basta decir que son procesos que nada
tienen que ver con la sincronización y que se realizan de forma independiente a ésta.
Pueden hacerse antes o después por igual, aunque personalmente prefiero hacerlas
siempre a posteriori por varias razones:

1. Haber sincronizado un audio implica haberlo escuchado prácticamente


entero, por lo que tenemos una mejor impresión sobre lo que tenemos y lo
que necesitamos modificar. Si nos ponemos a modificar algo antes de
haberlo escuchado corremos el riesgo de efectuar cambios que afecten de
desigual manera a toda la onda. Un ejemplo: aumentar graves cuando sólo
hay una carencia de graves en los primeros minutos, con eso creamos una
saturación de bajos innecesaria en todo el resto del audio.
2. No sólo habremos seguido el audio doblado sino que habremos escuchado
bastante del audio original. Tendremos una idea más aproximada y nuestro
oído estará más acostumbrado a escuchar algo que suena como debe para
poder tomarlo como referencia.
3. Ecualizar y filtrar puede eliminar o atenuar muchos sonidos que podrían
servirnos como referencia para poder sincronizar las bandas de audio. Mejor
trastear después sobre un audio ya perfectamente sincronizado que no
lamentar a posteriori el habernos cargado todos los sonidos de fondo...
cuando ya es demasiado tarde.

Página 12 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

4. Poder utilizar el audio VO en ocasiones nos va a proporcionar un tremendo


incremento de calidad en el audio resultante (como ya veremos más
adelante), pero para ello necesitamos que el doblaje esté perfectamente
sincronizado. Hasta entonces no podremos escuchar el resultado y por tanto
no sabemos si la banda de audio doblado necesita de determinadas
correcciones y filtrados.

En suma, la única corrección que debéis hacer antes de sincronizar es, en todo
caso y sólo si resulta muy insoportable, la eliminación del ruido de fondo, pero siempre
con precaución y afinando mucho el filtrado para no perder partes importantes.
Tal vez haya más cas os que os podáis encontrar y que no estén contemplados
en este manual, pero creemos que hemos tocado los más habituales. Si tenéis algún
caso raro del que no hayamos hablado decídnoslo e intentaremos ver la forma de
solucionarlo, así haremos crecer este manual con la experiencia de muchos.
CONSEJOS FINALES SOBRE SINCRONÍA
Para terminar con el apartado sobre sincronizaciones, y como norma general,
seguimos insistiendo en algo que venimos diciendo desde el principio "no hagáis
chapuzas si lo podéis solucionar de una forma más elegante". Ya sé que hay mucho
vago por ahí suelto pero dudo siquiera que se molesten en leer este manual, así que si
estás leyendo esto es que el tema te interesa y tratas de hacerlo lo mejor posible.
También sé de sobra que muchas de esas "pequeñas victorias" solucionando
problemas que al principio parecían irresolubles se quedan con el único
reconocimiento de ti mismo contigo mismo, porque nadie se va a enterar de lo que has
tenido que hacer para poder solventar ese pequeño fallito. Si precisamente lo has
dejado que casi no se nota nada... ¿quien se va a enterar? Pues como ya digo: tú
mismo eres el que sabe lo que has hecho, y no debe haber nadie más exigente que
uno mismo a la hora de hacer una tarea, si es que queremos hacerla realmente bien.
Así que ánimo, que merece la pena, y si hoy no te sale déjalo y lo vuelves a intentar
mañana o pasado, que ya verás como acabas solucionándolo (y esto, aunque os
parezca de perogrullo, es el mejor consejo que os puedo dar).
Un último consejo: no tengáis mucha prisa y os pongáis a hacer sincros como
locos, que no hemos acabado el manual y faltan partes muy interesantes que os harán
mejorar muy mucho los audios. Un pelín de paciencia que todo llegará. ;-)

7.- APROVECHAMIENTO DE LAS BANDAS VO


(Versiones Originales) - Parte 1
Este capítulo es uno de los más importantes del llamado "método SCL" (o
"método QS" como lo denomina el maestro Dhusuf), ya que es uno de los procesos
que más nos van a ayudar a lograr mejorar la calidad de los audios. Pero debéis tener
claro que no se trata de un proceso aislado, sino de una fase más de una serie de
procedimientos destinados a trabajar con audios. Si aplicáis sólo estas técnicas sin
hacer caso del resto de procesos con el audio, seguiréis haciendo las cosas a medias.
Así que os recomiendo aún más paciencia, que no sólo hay 6 partes previas a este
apartado sino que después de él habrá aún otras poquillas más. Pero no os cortéis de
ir aplicando todo lo dicho para ir cogiendo el tranquillo, que como ya dijimos la práctica
es un ingrediente fundamental.
La utilización de las bandas sonoras tiene varias aplicaciones, veamos las más
importantes (algunas ya se han comentado):

1. Ayuda a la sincronización como referencia 100% exacta

Página 13 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

2. Nos proporciona una referencia sobre el sonido como ayuda para ecualizar
correctamente el doblado
3. Sirve para rellenar aquellos trozos del doblaje que falten o sean defectuosos
4. Podemos mezclarla total o parcialmente para realzar la calidad y el estéreo del
doblaje

Por todo ello, es evidente que cuanto mejor sea la banda sonora original de más
utilidad nos será. Lo ideal sería contar con el audio en AC3, o en su defecto mp3 a 160
Kbps mínimo. Si el audio original está a 128 o menos entonces podemos olvidarnos de
usarla al 100%, aunque evidentemente aún nos puede servir para los puntos 1, 2 y 3.
Pero centrémonos en los puntos 3 y 4, ¿cómo podemos aprovechar ese audio VO y
mezclarlo con el doblaje?
Podemos “cortar y pegar” los trozos en los que no hay diálogos, sólo música y
efectos. Pongo lo de “cortar y pegar” entre comillas porque no se trata de hacerlo
literalmente, sino más bien de mezclar. Lo que haríamos sería abrir con el Cooledit en
una pista una copia del audio VO e ir eliminando los trozos con diálogo. Para evitar
que haya altibajos tendríamos luego que ir con toda paciencia usando los fade in y
fade out en cada trozo para que las transiciones se realicen de forma gradual.
Evidentemente si queremos que este proceso sea lo más perfecto posible, entonces al
audio doblado habría que realizarle las mismas operaciones pero a la inversa, con el
fin de que el volumen del audio a lo largo de toda la película fuese homogéneo.
Pero existe un sencillo truco que podemos realizar y que nos ayudará a eliminar
en parte esas voces VO no deseadas: la técnica del audio inverso. Veamos en qué se
basa esta técnica: como ya hemos comentado, una banda sonora se compone de tres
partes que se graban y procesan por separado: música, efectos y diálogos. La música
y los efectos se graban lógicamente en estéreo pero los diálogos suelen grabarse en
mono con el fin de que se puedan escuchar por igual por ambos canales. Esto
significa que en cada canal (L y R, de Left y Right, respectivamente izquierdo y
derecho) tenemos sonidos diferentes y sonidos comunes a ambos canales.
Cuando a una onda le sumamos su inverso, el resultado es la anulación del
sonido, digamos que "se restan". Si habéis leído los "Cuentos de la Taberna del Ciervo
Blanco" del maestro Arthur C. Clarke recordaréis que una de las historias trata
precisamente sobre una máquina capaz de generar silencio basándose en la suma de
ondas inversas. Aparte de ser un libro excelente, es una buena historia que ayuda a
comprender de qué estamos hablando. Aplicando ese fundamento a nuestros audios
lo que haríamos sería lo siguiente (explico primero la parte teórica):
Creamos una copia del canal izquierdo (L), invertimos la onda y la sumamos al
canal derecho (R). De la misma forma hacemos el mismo proceso con el canal
derecho sobre el izquierdo. El resultado sería el siguiente:

L2 = L1 - R1
R2 = R1 - L1

Donde L2 y R2 son los canales izquierdo y derecho resultantes, y L1 y R1 los


canales tal y como estaban antes del proceso. ¿Qué hemos conseguido con esto?
Pues sencillamente eliminar de cada canal aquellos sonidos que se hallan por igual en
ambos (es decir, sonidos monofónicos) y mantener sin embargo aquellos diferentes
(los estereofónicos).
Con respecto a lo que buscábamos eliminar (las voces), el aspecto positivo es
que las voces originales han disminuido bastante de intensidad, hasta incluso
desaparecer del todo en algunas partes. Como aspecto negativo nos encontraremos

Página 14 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

con que en muchas partes las voces no desaparecen sino que solo se amortiguan, y
además en según que BSO’s este truco de mezcla de audios inversos tiene mayor o
menor incidencia. Así pues no basta con realizar el método inverso, sino que hay que
revisar (escuchando atentamente) toda la banda de audio en busca de esas voces
residuales para irlas eliminando, o si no, no podríamos utilizar esa banda resultante.
Este es el proceso más largo y tedioso de todo el método, pero es necesario para
completar el proceso correctamente. Podéis eliminar los trozos que contengan voces
residuales disminuyendo su volumen o incluso silenciándolos del todo y realizando
fade out al principio del fragmento a eliminar y fade in al final para que las transiciones
sean suaves y no se noten en la mezcla final las variaciones de volumen. En caso de
duda podemos escuchar la mezcla de canales y ver cómo quedaría el resultado, ya
que muchas voces residuales pueden quedar tapadas por el doblaje y no haría falta
eliminarlas del todo, aunque de esto hay que asegurarse muy bien porque el que no lo
oigamos con nuestros cascos y/o altavoces no significa que no se vayan a escuchar
con otros diferentes.
Con respecto a lo que buscábamos mantener (música y efectos), el aspecto
negativo es lo primero que resalta ya que ha variado el sonido de la música y los
efectos, lógico al haber eliminado parte de los sonidos que componían todo el
conjunto, así que si escuchamos sólo ese audio resultante, lo que oímos nos resulta
extraño y algo incompleto. Pero hay que tener en cuenta que no vamos a usar esa
onda por si sola, sino mezclada con otras. Cuando lleguemos a la parte de mezclas
podremos ver cómo la incorporación de esta banda procesada y bien mezclada y
compensada, nos incrementa muchísimo la calidad de sonido del conjunto.
Está claro en todo este proceso que lo primero que necesitamos es obtener una
VO de la mejor calidad posible y, por supuesto, estéreo REAL. Por esa razón
descartamos cualquier formato por debajo de los 160 kbps, es necesario trabajar con
bitrate constante (CBR) en lugar de variable (VBR), siempre es mejor el audio en AC3
que en MP3 y son preferibles los sample rates de 48 KHz en lugar de los tan
malditamente usados 44,1. Hace unos años, cuando mandar 1 simple Mb por módem
era tarea que llevaba varios minutos, tenía sentido que se apurase el tamaño de los
archivos arañando por aquí y por allá, pero hoy en día resulta absurdo andar
ahorrando unos pocos bytes en algo tan importante. Si alguien no nota "apenas"
diferencia entre un mp3 a 128 con un mp3 a 160 ó 192, le aconsejaría que cogiese
unos buenos altavoces (o mejor aún, unos buenos cascos) y después de escuchar
bien ambos formatos se atreviese a seguir diciendo lo mismo. Por supuesto hablamos
de sonidos limpios y bien ecualizados, que una lata a 128 y una lata a 192 no se llevan
demasiada diferencia que digamos. X-D
Así pués, la situación ideal de partida es contar con un audio original en formato
AC3. Pero tengamos en cuenta, que la estructura de un fichero AC3 puede ir desde 2
hasta 6 canales. Veamos los distintos tipos que nos pdemos encontrar:

Ø 2 canales: L y R
Ø 3 canales: L y R + Surround
Ø 3 canales: L y R + Frontal (formato obsoleto)
Ø 4 canales: L y R delantero + L y R trasero (creo que este tampoco se usa ya)
Ø 4 canales: L y R + Frontal + Surround (conocido como 3.1)
Ø 5 canales: L y R delantero + L y R trasero + Surround (fué el famoso 4.1)
Ø 6 canales: L y R delantero + Frontal + L y R trasero + Surround (el tan popular
5.1)

Página 15 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

Creo que hay por ahí ya especificaciones 6.1 y 7.1, pero no las he trabajado aún,
además dudo que os encontréis por ahora un DVD con una configuración distinta a las
detalladas, y aunque así fuera el procedimiento a seguir no iba a variar. Así que una
vez que conocemos la estructura de nuestro AC3, conviene estudiar cada grupo de
canales por separado para ver qué podemos usar de ellos. Mi recomendación es
separar los canales en bandas independientes (luego veremos en la parte práctica
cómo hacer todo esto) y ver cómo podemos aprovecharlos, ya que cada grabación es
distinta y cada técnico de sonido puede haber elegido distintas formas de "repartir" el
sonido entre los canales. Si no queremos complicarnos demasiado la vida, ya que
nosotros vamos a trabajar en un formato estéreo, podemos reducir el AC3 a formato
wav (de dos canales), que es audio sin comprimir y sobre el cual podremos realizar la
técnica de la mezcla de audios inversos que vimos antes.
Si queremos trastear antes un poco, podemos realizar diferentes pruebas con las
diferentes bandas. Por ejemplo podemos escuchar la banda surround para ver si nos
puede valer, o podemos realizar mezclas de audio inverso con los canales delanteros
y traseros para ver con qué combinación nos queda un audio más aprovechable.
Tened en cuenta que las grabaciones originales en formato 5.1 son muy, muy
recientes, y que en muchas ocasiones (sobre todo en películas y series que tengan
unos pocos añitos) lo que estáis escuchando no es un 5.1 real, sino una adaptación a
6 canales realizada por los técnicos de grabación a partir de una fuente original
estéreo. Esto quiere decir que en muchas ocasiones nos vamos a encontrar con que
los canales L y R delanteros y los traseros son prácticamente idénticos (se han
limitado a duplicarlos), que el "surround" no es más que una banda monofónica con un
filtro de corte a frecuencias bajas y que el frontal es simplemente una suma de L+R
dividida por dos. Vamos, que de 2 canales se han sacado hábilmente 6 así por la pata.
X-D
Básicamente, el trabajo con audios VO requiere (como todo) paciencia, práctica
y muchas pruebas. No hay dos audios iguales y por tanto no se pueden dar
instrucciones que sirvan por igual para todos los casos. Los que trabajamos con series
tenemos la ventaja de que normalmente en ellas se mantiene una homogeneidad a lo
largo de cada temporada (aunque no siempre), por lo que son los primeros episodios a
los que tendremos que dedicar más tiempo. Una vez hayamos trabajado esos
primeros episodios conoceremos ya un montón de detalles que nos van a valer para
los siguientes, y eso siempre supone un ahorro de tiempo.
Es bueno, pues, detenerse en los primeros episodios de una serie dedicándoles
tiempo y esfuerzo a conocerlos y tratar de sacarles partido, ya que todo ese tiempo
empleado repercutirá a nuestro favor más adelante. De la misma forma, también es
mejor, lógicamente, que la misma persona haga todos los episodios de una misma
temporada, o en su defecto un grupo reducido de personas con buena comunicación
entre ellos (y similares niveles de exigencia) y realizando todos, de común acuerdo, las
mismas operaciones.

8.- APROVECHAMIENTO DE LAS BANDAS VO


(Versiones Originales) - Parte 2
Para todos los procesos que necesitamos realizar tenéis varios programas muy
buenos, mi consejo es que utilicéis aquel con el que más cómodos os sintáis o el que
más prestaciones os proporcione. Tened en cuenta que los programas cambian y
mejoran constantemente, por lo que el mejor programa para algo hoy puede dejar de
serlo pasado mañana, así que no vamos a recomendar ninguno en particular. Los
programas que os voy a mencionar son los que uso yo en este momento, pero eso no

Página 16 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

quita para que pueda usarse cualquier otro programa que os de las mismas o incluso
mejores prestaciones.
Para analizar y extraer los AC3 yo utilizo el Ciler's AC3 Tool. Primeramente de
todo conviene usar la opción "launch analysis ", la cual nos va a proporcionar toda la
información que necesitamos conocer sobre el contenido y la estructura de ese AC3,
especialmente qué canales incorpora. Una vez sabemos de cuántos canales consta el
fichero, ya podemos comenzar la extracción a formato wav. Os recomiendo probar
distintas formas de equilibrar los controles ya que obtendréis resultados muy diferentes
según la naturaleza del AC3 con el que estéis trabajando. Como primera prueba,
sacad los canales de forma separada para poder escuchar posteriormente el
contenido de dichos canales. Al hacer la conversión AC3 -> wav debéis seleccionar el
downmix (-d) y el output channels configuration (-o), ahí es donde hay que decirle lo
que queréis que os saque. Si el AC3 es 2.0 evidentemente sólo podréis obtener un
wav estéreo, así que no hay más opciones (sólo se podrán intercambiar los canales
como mucho), pero si el AC3 es, por ejemplo, 5.1 se le puede indicar que mantenga el
formato 5.1, y de esa forma os sacará 6 wavs, correspondientes a cada canal del AC3.
Posteriormente abrís todos esos wavs en modo multipista en el Cooledit y ya podréis
trajinar con ellos a gusto.
También podéis realizar el "downmix" (mezclado) para reducir a un estéreo
normal en sus dos canales L/R. La mejor forma de obtener resultados es probar y
conocer, no existe una regla única y tendríamos que estar aplicando distintas reglas
para cada caso con el que podríamos encontrarnos, y no se trata de hacer eterno este
manual. X-D
Otra cosa muy útil que podemos realizar con el AC3 Tool es aumentar el nivel
de ganancia de entrada (Main Gain Correction) en aquellos casos en los que el nivel
de volumen del AC3 extraído sea muy bajo. Esto nos permite subir el volumen en caso
de necesidad a partir de la propia fuente, en lugar de tener que hacerlo posteriormente
sobre un sonido ya procesado y reconvertido.
Si el formato en el que tenéis la VO es mp3, entonces tendremos que usar algún
programa que nos lo convierta a wav. Yo utilizo para ello el Soundforge, pero tenéis
un buen montón de utilidades que podéis usar. Aseguraos únicamente de respetar el
sample rate que tengáis en el fichero original, ya mencionamos en partes anteriores de
este manual la importancia de preservar la homogeneidad.
Una vez tenemos ya en wav todo el material con el que vamos a trabajar
(bandas originales, doblajes y lo que se tercie), entonces necesitamos un programa de
edición de ondas que sea multicanal. Yo utilizo el Cooledit, un estupendo programa
que permite abrir y procesar tantas bandas de audio como necesitemos, tanto
individualmente como la mezcla de todas ellas. Es como tener una mesa de mezclas
virtual en la que además podemos editar por completo cada uno de los canales, hacer
y deshacer todo lo que haga falta, y escuchar en tiempo real el resultado.
Además el Cooledit incorpora una serie de procesos predefinidos que podemos
utilizar, y uno de ellos es precisamente el "vocal cut". El vocal cut va a hacer
exactamente lo que describimos en la parte teórica, es decir realizar la mezcla de
ondas inversas entre canales cruzados en un sólo paso. Pero tened cuidado a la hora
de utilizarlo porque en algunas versiones del Cooledit el proceso lo realiza de forma
incompleta o imprecisa, y hay por ahí unas cuantas versiones diferentes funcionando.
Editad el proceso predefinido y ved lo que está realmente haciendo para ver si es el
proceso correcto que describimos anteriormente, y así podéis usarlo con más
tranquilidad.
Importante también es que tengáis en cuenta que los programas son software, y
que el software tiene sus fallos y sus sorpresitas desagradables. Trabajando bajo
entorno Windows es muy común quedarse corto de memoria por la mala gestión de la

Página 17 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

misma que hace. Cooledit y Soundforge necesitan bastante memoria (sobre todo
cuando cargas varias ondas y haces muchas modificaciones sobre ellas). Puede
ocurrir con relativa facilidad que te quedes corto de memoria mientras estás trabajando
y sin que te des cuenta las ondas empiecen a corromperse, si salvas y sobrescribes
en ese momento el trabajo (como es conveniente hacer frecuentemente), puedes
machacar todo el trabajo hecho hasta el momento. Si eso te ocurre después de llevar
varios días con un audio recalcitrante te aseguro que es para darse de cabezazos con
el monitor. Es, pues, conveniente asegurarse de que todo sigue en su sitio, y ante la
duda salva los progresos con distinto nombre, así al menos solo tendrás que
retroceder hasta lo último que guardaste.
Otro tema importante: no modifiquéis nunca el archivo de la banda de audio
original ya que va a ser vuestro punto de referencia para muchos procesos y os hará
falta tenerlo íntegro. Realizad copias del mismo y abrid cada proceso en una pista
distinta. Ahora comprenderéis por qué es tan vital (como decíamos en la parte
referente a sincronizaciones) que la sincronización sea lo más perfecta posible. Si
vamos a mezclar diferentes ondas es importante, no sólo que se hallen lo más
sincronizadas posible (siempre tomando como referencia la VO original, que es la que
manda), sino que además se hallen en fase, y que los canales L y R sean los mismos
en todas las bandas a mezclar (que no estén intercambiados).
Para que comprendáis esto un poquito mejor, os comentaremos en qué afectan
ambas cuestiones con más detalle. Recordad que hemos aplicado una inversión de
fase para eliminar las voces, por lo que evidentemente mezclar dos ondas con fase
inversa hace que en lugar de sumarse ambos sonidos, en realidad se anulen. Por ello
si no nos damos cuenta de ello y sumamos dos ondas, ambas con buen sonido pero
con fases opuestas, el resultado será una onda bastante disminuida, mas baja de
volumen y de peor calidad que las dos anteriores por separado, ya que hemos
eliminado sonidos en lugar de sumarlos. Así que como veis, el "pequeño detallito" de
las fases es muy, muy importante. Que no os pase como a mí, que en más de una
ocasión se me ha escapado alguna de estas trastadas por no verificar bien los canales
antes de sumarlos. ;-)
Con respecto al intercambio de L y R, os lo explicaré con un ejemplo sencillote.
Tenemos un sonido de una moto que se acerca por la izquierda, pasa por delante de
nosotros a toda pastilla y se aleja por la derecha. En un sonido estéreo correcto
escucharíamos a la moto acercarse por el canal L, se iría incrementando dicho sonido
conforme se acercara y a partir de cierto punto, cuando la moto estuviera muy
cerquita, el sonido empezaría a escucharse también por el canal R y aumentando
rápidamente. En el momento en el que la moto estuviera delante de nosotros ambos
canales emitirían el mismo sonido, y a partir de ahí comenzaría a desaparecer
rápidamente del canal L para quedar sólo en el canal R. Toda esta secuencia dura
apenas unas décimas de segundo, pero si el sonido y la imagen están bien
conjuntadas el efecto que nos produce al ver-oír el paso de la moto es lo más parecido
a la realidad. Ese es el fundamento del estéreo, intentar reproducir lo mejor posible la
realidad de cómo escuchamos al contar con dos oídos que nos permiten sentir esa
"espacialidad" o "tridimensionalidad" del sonido. Pues bien, evidentemente, si cuando
mezclamos dos ondas no tenemos en cuenta la homogeneidad de esa distribución de
canales, podemos anular sin querer un precioso estéreo. Acudiendo al ejemplo
anterior: en una banda la moto entraría por la izquierda y saldría por la derecha, en la
otra banda entraría de derecha a izquierda, y al sumar ambas simplemente
escucharíamos todo el rato la moto en el centro; habríamos perdido la sensación de
estéreo.
Ahora unas pistas para solventar estos incidentes tontorrones: Comprobar la
fase es tan sencillo como encontrar dos sonidos lo más parecidos posible y comparar
su forma de onda en la banda original y en la doblada, si ambas ondas llevan la misma

Página 18 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

dirección (ascendente o descendente) entonces es que están en fase, mientras que si


una es ascendente y la otra descendente entonces es que están invertidas de fase.
Para resolverlo simplemente tenemos que modificar una de las bandas y aplicar un
simple proceso inversor de onda sobre ella (Nuevo L = antiguo -L y nuevo R = antiguo
-R).
De la misma forma podemos detectar los cambios de canal (L por R)
inspeccionando la forma de las ondas de forma visual. Buscad en la VO una parte en
la que los canales L y R tengan una forma de onda claramente diferente y comparad
esa misma parte en las otras bandas a mezclar. Si tenéis dudas sobre cual es la
asignación L y R correcta, recurrid a las tradicionales buenas relaciones entre la vista y
el oído reproduciendo esa parte del avi original y viendo cuál sería la asignación más
lógica según lo que estéis viendo. Si tenéis dudas, dad prioridad a lo que indique la VO
ya que normalmente (salvo patochadas raras que a veces se ven) será la que esté
correcta. Para corregir una banda con canales cambiados utilizad el "swap channels",
que no es más que un simple: (nuevo L = antiguo R y nuevo R = antiguo L).
Si cumplimos correctamente todos los pasos tendremos una serie de bandas
que poder mezclar para obtener el audio definitivo. Con el Cooledit podemos
escuchar el resultado y asegurarnos de los niveles de volumen a aplicar a cada canal,
si subimos demasiado la música y los efectos podemos hacer que resulte difícil
escuchar las voces en algunas partes (algunas de por sí ya vienen bastante bajas de
origen en ocasiones), y si, por el contrario, bajamos demasiado ese refuerzo, entonces
apenas se notarán las mejoras y el trabajo realizado quedará bastante apagado y
desperdiciado. Igualmente, un exceso de efecto surround puede ser contraproducente
ya que no todo el mundo va a tener unos peazo altavoces 5.1 de 300 €, o va a
escuchar los montajes a través de su cadena estéreo. Aquellos que escuchen a través
de altavoces sencillitos o del cutre-altavoz de la TV ese sensacional efecto surround
pueden sufrir una tortura sónica en forma de ruidos. Hay un buen truco para saber si
un grabación va a sonar bien en diferentes entornos: si suena bien y se distinguen los
detalles a volumen bajo y sigue sonando bien, sin saturaciones ni distorsiones y
siguen distinguiéndose bien voces ruidos y música a volumen muy alto, entonces es
que la mezcla está bastante bien compensada.
CONSEJOS FINALES DEL MANUAL
Con todo esto tenéis ya bastantes pistas para proceder a realizar vuestros
montajes aprovechando muchas de las posibilidades que tenemos fácilmente a
nuestro alcance. Id realizando prácticas y no os desaniméis si al principio las cosas no
salen según lo esperado, lo raro sería que os saliera todo bien de primeras. Yo llevo
usando estas técnicas bastante tiempo y sigo aprendiendo cosas constantemente, por
muy bien que lo hagas siempre se puede mejorar. Y de eso se trata, que cada sincro
sea mejor que las anteriores. ;-)
Dejo abierto el manual para alguna entrega posterior, aunque como digo lo
principal ya está dicho. Quedan pendientes algunos apuntes sobre ecualización,
eliminación de ruidos y algunos truquillos, pero ya hablaremos sobre ello más
adelante. También espero comentarios vuestros sobre si el manual explica
suficientemente todas las dudas que se os pueden plantear o si consideráis que hay
algo que no hemos tocado o que deberíamos explicar más en profundidad. Igualmente
será bienvenida cualquier aportación, corrección, puntualización o ampliación a lo
dicho que deseéis aportar.
Este manual está hecho con la intención de ayudar a todo aquel que quiera
realizar montajes de audio a la mejor calidad posible, e intenta sensibilizar sobre la
importancia que tiene un buen sonido. Si todos empezamos a hacer mejores ripeos,
con mejor imagen y mejor sonido, todos ganaremos. Espero os sea de utilidad.
26-X-2003 v 1.0

Página 19 de 20
Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

Las webs de ShareRip son:


v Web de Cifirip: http://www.cifirip.tk
v Web de Terrorrip: http://www.terrorrip.tk
v Web de Misteryrip: http://www.misteryrip.tk
v Web de subXpacio: http://www.subxpacio.tk

Si queréis contactar con el autor de este manual dirigíos a:


v speed2001@terra.es
Si queréis contactar con la persona que le ha dado formato a este manual dirigíos a:
v danisaur@hotmail.com

Página 20 de 20

You might also like