You are on page 1of 3

Determinación de Parámetros en una Reconstruccion

de Una Señal De Audio


Andres Valencia (alejos0304@gmail.com)
Estalin Fuentes (andy_one@hotmail.es)

Escuela Superior Politécnica de Chimborazo


Riobamba, Ecuador

Resumen— El presente artículo detalla las diferentes etapas que El grado de superposición describe la cantidad del anterior
se realiza para analizar paso a paso los parámetros que tiene una marco que se repite en la trama siguiente superposiciones de
señal de audio, además de conocer sus diferentes etapas y que 25% y 50% son comunes. [2]
significa cada una de ellas. Se analizará con Matlab para estudiar
más a fondo cada uno de sus parámetros y los resultados de la
simulación.
Speech

Palabras Clave:. LPC, SPEECH, FILTER. No hay nada especial sobre el discurso de un audio en
perspectiva es simplemente como cualquier otro sonido, sólo
cuando la escuchamos que nuestros cerebros comienzan a
interpretar una determinada señal. [3] Aparte de este
I. INTRODUCCIÓN . comportamiento interpretativo del cerebro humano, hay
características de audio dentro de la música y otros sonidos
El procesamiento de audio incluye diferentes aplicaciones que son inherentemente discursos similares en sus
tecnológicas, como la reproducción de música en alta características espectrales y temporales Sin embargo el habla
fidelidad, el reconocimiento del habla o la síntesis del habla[1]. en sí, es un conjunto estructurado de sonidos continuos, en
Se pretende combinar una explicación teórica de los virtud de su mecanismo de producción. [4]
principales conceptos del procesamiento de audio y ver sus
aplicaciones más relevantes, con una vertiente práctica que Características del speech
permita lograr mejor algunos de los conceptos expuestos.
A pesar de que muchas diferencias entre los individuos, y la
Se propone entonces la identificación de algunos parámetros existencia de muchos idiomas, el habla sigue las pautas
espectrales que caracterizan y determinan la calidad de la voz, generales y en promedio tiene características únicas así como
de tal manera de lograr una mejor aproximación en la las de volumen, distribución de frecuencia, pitch rate and
clasificación de los mismos de acuerdo a sus propiedades, esto syllabic rate. [4]
se realizó a través de un análisis sistemático mediante técnicas Estas características se han adaptado con respecto a medio
de procesado digital de señales. Estas técnicas aplicadas a las ambiente, la audición y la producción de la voz limitaciones,
señales de voz digitalizada permitirán determinar las pero los rápidos cambios en la sociedad durante el siglo
propiedades espectrales. [1] Así se dispondrá de mayor pasado han superado nuestra capacidad de adaptación. [5]
información objetiva para la clasificación y determinación de El alfabeto fonético internacional (IPA) es la habitual método
la calidad de voz. para describir y escribir los diferentes fonemas que recuperan
el habla.
II. MARCO TEÓRICO Físicamente, los sonidos del habla pueden describirse en
términos de un contorno de tono y frecuencias de los
Segmentación formantes.
De hecho esta descripción constituye un método de análisis
Es necesaria no sólo porque 256 es un cómodo tamaño, pero utilizado por la mayoría de los algoritmos de compresión de
cuando cualquiera de las siguientes son verdaderas: voz
El audio es continua (es decir, no se puede esperar para una Formantes son frecuencias resonantes del tracto vocal que
muestra final llegue antes de comenzar el procesamiento) aparecer en el espectro de voz como picos claros.
La naturaleza de la señal de audio está cambiando Formantes se han descrito como la más sencilla característica
continuamente, o características a corto plazo son importantes importante en las comunicaciones de voz. [5]
El tratamiento aplicado a cada bloque de las escalas de forma
no lineal en complejidad (es decir, un bloque doble de grande
sería cuatro o incluso ocho veces más difícil para procesar). [2]
compresión, y lo ideal es no cambiar el sonido de cualquier
manera que no sea puramente cambiar su volumen. [5]

Filtro pre-enfasis.

Es un filtro digital pasa alto a la señal de primer orden para las


formantes de frecuencias altas, se realiza para que no se pierda
información de la señal durante la segmentación ya que en
frecuencias bajas se encuentra una gran cantidad de
información. Así mismo a la señal de la componente DC la
remueve logrando aplanar espectralmente la señal. [6]
III. DETALLE DE LA IMPLEMENTACIÓN.
Ilustración 1: speech

Cuantización

El proceso de cuantificación es la reducción de la cantidad de


información almacenada.
Es necesario reducir el número de bits necesarios para
almacenar el audio, pero sin comprometer la calidad
demasiado. [3]
Modulación por impulsos codificados (PCM) es el formato
entregado por la mayoría de los convertidores de analógico a Ilustración 3: señal original
digital (ADC) y el formato de elección para la representación
function [energ,co]=
de audio en una computadora. La mayor parte de
coeficientes(trama2,Ntramas,trama);
procesamiento de señal digital discreto se basa en PCM. [7]
%%% CALCULAMOS ENERGIA y los coeficientes
co=lpc(trama2,10);
residuo2=filter(co,1,trama2);
energ=sum(residuo2.^2);

Ilustración 2: cuantización
Ilustración 4: coeficientes LPC
Parametrizacion

Normalmente, ocho o 10 coeficientes de predicción lineal del


Consejo de Europa (LPC ).
LPC son polinomios generadores para un filtro digital que,
cuando es estimulado con un poco de señal de entrada, recrea
las características de las muestras originales.
Linear codificación predictiva (LPC) se ha utilizado con éxito,
en la codificación de voz. [4]
Normalización

Normalizar audio es cambiar su volumen global en una


cantidad fija para alcanzar un nivel objetivo. Es diferente de
compresión que cambia de volumen en el tiempo en Ilustración 5: pitch
cantidades variables. No afecta a la dinámica como la
BIBLIOGRAFIA

[1] [1] J. Vignolo. Introduccion al Procesamiento Digital de


Señales.Pontifica 2008Uiversidad Catolica de Valparaiso. 2008
[2] [2] I. McLoughlin. Applied Speech and Audio Processing.
Cambridge University Press. 2009
[3] [3] Richard G. Lyons “Understanding Digital Signal Processing”
Prentice Hall, 2001
[4] [4] Julius O. Smith III, Introduction to Digital Filters with Audio
Applications. W3K, 2007
[5] [5]Oppenheim, Schafer, Discrete Time Signal Processing. Pearson,
Ilustración 6: señal reconstruida 2010.
[6] Rincón Pasaye, José Juan, “Procesamiento Digital de Señales”,
Facultad de Ingeniería Eléctrica, Universidad Michoacana de San
IV. EVALUACIÓN Y RESULTADOS Nicolás De Hidalgo, Junio de 2009.
[7] Dr. Martínez Castillo, Geovanni, “IE-0527 Ingeniería de
Comunicaciones”, Folleto de clase, II semestre 2010.
Empezamos con realizar la segmentación que se la realiza con
la ventana de haming de 240 muestras, en un tiempo pre-
establecido.
Luego la normalizamos toda la señal con la más alta
frecuencia para tener valores estables.
Luego aplicamos un filtro para sacar el pitch, que es la AUTORES
frecuencia fundamental y la eliminamos, luego sacamos los
Lpc que vayamos a analizar, en este caso lo haremos con 10. Andrés Alejandro Valencia
A su vez estos coeficientes deben ser cuantizados y Enríquez. Nació en Santo Domingo
codificados y enviados desde el trasmisor. de los Colorados, Santo Domingo de
Una vez que estamos en el trasmisor, que tenemos solo ruido, los Tsáchilas-Ecuador, el 03 de Abril
debemos aplicar el proceso inverso, y reconstruir la señal a de 1990. Educación básica cursada
partir de la enviada. en la escuela “UNE” de la ciudad de
Una vez aplicada el proceso inverso, debemos tener una señal Santo Domingo de los Colorados.
casi idéntica a la original. Estudios secundarios realizados en el
Instituto Técnico Superior “Julio
En la ilustración 5 podemos observar la frecuencia Moreno Espinoza”. Estudios
fundamental, la cual va hacer removida al aplicar el filtro de superiores realizados en la Escuela Superior Politécnica de
pre-énfasis Chimborazo obteniendo el título de Ingeniero en Electrónica,
Telecomunicaciones y Redes. Actualmente cursando la
V. CONCLUSIONES Maestría en Sistemas de Telecomunicaciones.

El proceso de normalización de la señal, sirve para obtener Estalin Andrés Fuentes Salazar.
valores estándares en toda la onda, y obtener la ganancia del Nacido en Santo Domingo de los
mismo. Colorados, Santo Domingo de los
Tsáchilas-Ecuador, el 10 de Junio de
La parametrizacion de una señal nos sirve para identificar paso 1990. Educación básica cursada en la
a paso cada una de las características de las señales, y a su vez escuela “7 de Octubre” de la ciudad
poder variar los parámetros de acorde a lo que se desee de Santo Domingo de los Colorados.
estudiar y analizar. Estudios secundarios los realice en el
Instituto Técnico de Comercio “ITC
Los filtros aplicados para obtener el pitch y los coeficientes Amazonas”. Estudios superiores
son filtros de pre-énfasis, que eliminan las frecuencias altas de realizados en la Escuela Superior Politécnica de Chimborazo
la señal. obteniendo el título de Ingeniero en Electrónica,
Telecomunicaciones y Redes. Actualmente cursando la
El decodificador realiza el proceso inverso, para lograr Maestría en Sistemas de Telecomunicaciones.
recuperar la señal, aunque esta no es recuperada en un 100%,
hay distorsiones que son imperceptibles al oído humano.

You might also like