Professional Documents
Culture Documents
Tema
1 Introduccin
VoIP proviene del ingles Voice Over Internet Protocol, que significa "voz
sobre un protocolo de internet". Bsicamente VoIP es un mtodo por el cual
tomando seales de audio analgicas del tipo de las que se escuchan
cuando uno habla por telfono se las transforma en datos digitales que
pueden ser transmitidos a traves de internet hacia una direccin IP
determinada.
VoIP permite la unin de dos mundos histricamente separados, el de la
transmisin de voz y el de la transmisin de datos. Entonces, podemos decir
que VoIP no es un servicio sino una tecnologa. VoIP puede transformar una
conexin standard a internet en una plataforma para realizar llamadas
gratuitas por internet. Usando algunos de los software gratuitos para
llamadas VoIP que estn disponibles en internet de esta forma estariamos
saltandonos a las compaas tradicionales de telefona, y por consiguiente,
sus tarifas.
En el pasado, las conversaciones mediante VoIP solan ser de baja calidad,
esto
se
vio
superado
por
el
desarrollo
tecnologico
en
temas
de
2 Voz sobre IP
2.1 Paquetizacin de la voz
Para poder transmitir las muestras codificadas de voz sobre redes de datos,
es necesario armar paquetes. Si la voz est codificada con ley A, una
conversacin consiste en un flujo de 64 kb/s. Cada muestra dura
125 s. Si bien se podra formar un paquete con cada muestra de voz, esto
generara un sobrecarga (overhead) demasiado importante (recordar que
cada paquete requiere de cabezales). Por otro lado, si se espera a juntar
demasiadas muestras de voz, para formar un paquete con mnima
sobrecarga porcentual, se pueden introducir retardos no aceptables. Un
paquete IP puede tener hasta 1500 bytes de informacin.
Si con muestras de 64 kb/s se quisiera completar los 1500 bytes del
paquete IP, se introducira un retardo de 125s x 1500 = 187,5 ms. Esta
demora no es aceptable en aplicaciones de voz.
Por esta razn, se toman generalmente ventanas de 10 a 30 ms. Las
muestras de voz de cada una de estas ventanas consecutivas se juntan y
con ellas se arman paquetes.
recomendaciones,
que
reducen
la
velocidad
de
transmisin
Prdida de paquetes
A diferencia de las redes telefnicas, donde para cada conversacin se
establece un vnculo estable y seguro, las redes de datos admiten la
prdida de paquetes.
Esto est previsto en los protocolos seguros de alto nivel, y en caso de
que ocurra, los paquetes son reenviados. En los protocolos diseados para
trfico de tiempo real generalmente no se recibe confirmaciones de
recepcin de paquetes, ya que si el canal es suficientemente seguro, estas
confirmaciones cargan intilmente al mismo.
En aplicaciones de voz y video, el audio es encapsulado en paquetes y
enviado, sin confirmacin de recepcin de cada paquete.
Si el porcentaje de perdida es pequeo, la degradacin de la voz tambin lo
es.
Los porcentajes de perdida admisibles dependen de otros factores,
como por ejemplo la demora de transmisin y el factor de compresin
de la voz.
Existen tcnicas para hacer menos sensible la degradacin de calidad en la
voz frente a la prdida de paquetes. La ms sencilla consiste en
simplemente repetir el ltimo paquete recibido.
Tambin cuentan como perdidos los paquetes que llegan a destiempo o
fuera de orden.
Demora
Un factor importante en la percepcin de la calidad de la voz es la demora.
La demora total est determinada por varios factores, entre los que se
encuentran:
En
los
sistemas
telefnicos
este
efecto
no
tiene
mayor
Eco
Si el tiempo transcurrido desde que se habla hasta que se percibe el retorno
de la propia voz es menor a 30 ms, el efecto del eco no es percibido.
Asimismo, si el nivel del retorno est por debajo de los 25 dB, el efecto del
eco tampoco es percibido. En las conversaciones telefnicas habituales, el
eco existe en niveles perceptibles (mayores a 25 dB), pero la demora es
mnima, por lo que el eco no es perceptible. Las excepciones son las
comunicaciones va satlite, en las que la demora promedio es del orden de
los 150 ms. Para estos casos, las compaas telefnicas disponen
generalmente de sofisticados equipos canceladores de eco.
Variaciones en la demora (Jitter)
El jitter es la variacin en las demoras (latencias). Por ejemplo, si dos
puntos comunicados reciben un paquete cada 20 ms en promedio, pero en
determinado momento, un paquete llega a los 30 ms y luego otro a los 10
ms, el sistema tiene un jitter de 10 ms.
El receptor debe recibir los paquetes a intervalos constantes, para poder
regenerar de forma adecuada la seal original. Dado que el jitter es
inevitable, los receptores disponen de un buffer de entrada, con el
objetivo de suavizar el efecto de la variacin de las demoras. Este buffer
recibe los paquetes a intervalos variables, y los entrega a intervalos
constantes.
Es de hacer notar que este buffer agrega una demora adicional al
sistema, ya que debe retener paquetes para poder entregarlos a
intervalos constantes.
Cunto ms variacin de demoras (jitter) exista, ms grande deber ser el
buffer, y por lo tanto, mayor demora ser introducida al sistema.
Tamao de los paquetes
El tamao de los paquetes influye en dos aspectos fundamentales en la
transmisin de la voz sobre redes de datos: La demora y el ancho de
banda requerido.
Para poder transmitir las muestras codificadas de voz sobre una red de
datos, es necesario armar paquetes, segn los protocolos de datos
utilizados (por ejemplo, IP). Un paquete de datos puede contener varias
3 CODEC G.729
El codec G.729 estndar ITU, se basa en el Algoritmo Code Excited Linear
Prediction (CELP) y sus variantes CS-ACELP.
Perteneciente a la familia de los codificadores paramtricos, los cuales se
basan en la obtencin de los parmetros de un modelo de produccin de
seal de voz.
Los codificadores paramtricos analizan por prediccin lineal el filtro
correspondiente al modelo de generacin de seal de voz.
Digitalizacin de la voz
Como primer paso la voz debe ser obtenida mediante un transductor y
luego pasar a travs de PDS en el cual ser muestreada y cuantificada, para
la codificacin existen diversas tcnicas pero la que usaremos ahora esta
bajo el esquema de la recomendacin G.729 con el algoritmo CS-ACELP.
(Procesamiento Digital de Seales)
obtenidos con las tcnicas ACR (es decir, el MOS) puede estar sujeto al tipo
de experimento realizado. Por ejemplo, si se utilizan varias muestras de
buena calidad, una en particular puede ser calificada peor que si esa misma
muestra se presenta junto a otras de peor calidad.
Los mtodos subjetivos son en general caros y lentos porque requieren un
gran panel de usuarios. Son dependientes entre otros factores del pas, del
idioma, de las experiencias previas de los usuarios.
4.2 E-Model
La industria de las telecomunicaciones ha aceptado una representacin
numrica de la calidad de la voz, llamada MOS (Mean Opinion Score), y
estandarizada en la recomendacin ITU-T P.800. La calidad de la voz es
calificada con un nmero, entre 1 y 5. El valor numrico de MOS es
proporcional a la calidad de la voz. 1 significa muy mala calidad y 5 significa
excelente. Los valores son obtenidos mediante el promedio de las opiniones
de un gran grupo de usuarios.
La ITU-T ha creado un modelo en la recomendacin ITU-T G.107, llamado
EModel, para estimar o predecir la calidad de la voz en redes IP (VoIP)
percibida por un usuario tpico, en base a parmetros medibles de la red. El
resultado del E-Model es un factor escalar, llamado R (Transmission
Rating Factor), que puede tomar valores entre 0 y 100. El E-model
toma en cuenta una gran cantidad de factores que pueden deteriorar la
calidad de la voz percibida, como por ejemplo, el uso de compresin, los
retardos de la red, as como tambin los factores tpicos en telefona como
la prdida, ruido y eco. Puede ser aplicado para estimar la calidades de la
voz en redes de paquetes, tanto fijas como inalmbricas.
El E-Model puede ser utilizado para evaluar como se ver afectada la
calidad de la voz en una red en base a parmetros mensurables. El modelo
parte de un puntaje perfecto (100) y resta diversos factores que
degradan la calidad, segn se puede ver en la ecuacin.
R = Ro - Is - Id Ie_eff + A ...........................(1)
Donde:
..................... (2)
Donde:
Iolr Representa la disminucin de calidad producida por valores demasiado
bajos de OLR (Overall Loudness Rating). El OLR se calcula, a su vez, como
OLR = SLR + RLR
............................(3)
Siendo:
SLR (Send Loudness Rating), es la prdida entre la boca del emisor y el
micrfono del aparato telefnico. RLR (Receive Loudness Rating), es la
prdida entre el parlante del
aparato telefnico y el odo del receptor.
Ist Representa la degradacin producida por efectos locales no ptimos, y
depende esencialmente del factor STMR (Side Tone Masking Rating).
..............................(4)
Donde:
Idte Expresa una estimacin para las degradaciones debidas al eco para el
hablante. Se calcula en base al factor TELR (Talker Echo Loudness
Rating) y la demora media T de punta a punta en un sentido. El factor TELR
es la medida de la atenuacin del eco percibido por el hablante.
Idle Representa degradaciones debidas al eco para el oyente. Se calcula en
base al factor WEPL (Weighted Echo Path Loss) y la demora media Tr de ida
y vuela. El factor WEPL es la medida de la atenuacin entre la seal
directa recibida por el oyente, la seal retardada recibida como eco.
Idd Representa la degradacin producida por retardos absolutos demasiado
largos Ta, que se producen incluso con compensacin perfecta del eco. Si Ta
< 100 ms, el factor Idd es 0.
La frmula de clculo detallada de los parmetros (Idte, Idle, Idd) puede
verse en la recomendacin G.107.
Donde
Ie Es un valor que depende del Cdec utilizado, y representa la degradacin
percibida producida por los diferentes algoritmos de compresin.
Ppl Representa la probabilidad de prdida de paquetes
Bpl Se define como el factor de robustez contra prdida de paquetes, y es
un valor preestablecido para cada Cdec
BurstR Es la Relacin de rfaga, y se define como:
En una red sin prdida de paquetes y sin eco, el valor de R del EModel,
depender de la demora y de los codecs utilizados, segn se muestra en la
siguiente grfica, para G.711, G.729A y G.723.1 (notar que la grfica
negra coincide con las grficas anteriores)
Clculo de A
A representa un Factor de Mejoras de Expectativas. Muchas veces, los
usuarios estn dispuestos a aceptar peor calidad de voz si saben que se
estn utilizando tecnologas no clsicas (por ejemplo celulares o VoIP). No
existe, por consiguiente, ninguna relacin entre A y los dems parmetros
de transmisin.
El cuadro siguiente presenta los valores tpicos de A para diferentes
tecnologas, segn la recomendacin ITU-T G-113
Relacin de R y MOS
El modelo relaciona el valor de R con el MOS, con un gran nivel de
aproximacin, segn la siguiente ecuacin:
anterior:
extranets.
inversin.
Frame Relay)
6 Conclusiones
En conclusin si a todo lo anterior, se le suma el fenmeno creciente
llamado Internet, junto con el potencial ahorro econmico que este tipo de
tecnologas puede llevar acarreado, la conclusin es clara: El VoIP (Protocolo
de Voz Sobre Internet - Voice Over Internet Protocol) es un tema "caliente" y
estratgico para las empresas.
Hoy, desregulacin mediante, la telefona sobre IP empieza a ver su hora
ms gloriosa y es el fruto ms legtimo de la convergencia tecnolgica.
La transmisin de la voz sobre redes de datos debe su desarrollo a la rpida
evolucin de las tecnologas de procesamiento digital de seales y al
desarrollo conjunto de algoritmos de compresin que permiten aprovechar
el ancho de banda de Internet.
Existen algoritmos de codificacin que pueden minimizar aun ms el ancho
de banda necesario para la transmisin de voz, pero el sacrificio est en la
calidad perceptual.
7 Referencias
TIA/TSB 116-A Telecommunications - IP Telephony Equipment Voice
Quality Recommendations for IP Telephony, Mar 1, 2006
http://www.w3.org/AudioVideo/9610_Workshop/paper11/paper11.html
Calidad de servicio percibida en servicios de voz y video sobre IP, Pedro
Casas
Hernandez, Diego Guerra Vidal, Ignacio Irigaray Bayarres, Universidad de la
Republica, Proyecto de fin de carrera, Ingenieria Elctrica Plan 97,
telecomunicaciones, 30 de Agosto de 2005.
Transmisin de voz sobre IP con protocolo basado en el algoritmo lms,
Carlos
Alberto Busso Recabarren, tesis para optar al grado de magister en ciencias
de la
ingenieria mencin elctrica, santiago de chile JULIO 2003.
An E-Model Implementation for Speech Quality Evaluation in VoIP Systems,
Leandro Carvalho, Edjair Mota, Regeane Aguiar, Ana F. Lima, Jos Neuman
de
Souza, Anderson Barreto, Federal University of Amazonas (UFAM), Federal
University of Cear (UFC), Nokia Institute of Technology (INdT).
Simulacin of voice over IP for the Battlespace Communications
System(land),
Ian Grivell and Raymee Chau, department of defense of Australia, 2004.
AdaMOS: Algoritmo MOS-Adaptativo para fonts VoIP, Bruno de Azevedo
Vianna, Nilmax Teones Moura, Clio Vinicius Neves de Albuquerque, Vinod E.
F.
Rebello e Cristina Boeres, Instituto de Computao Universidade Federal
Fluminense(IC/UFF)