Professional Documents
Culture Documents
Resumen— El presente artículo detalla las diferentes etapas que El grado de superposición describe la cantidad del anterior
se realiza para analizar paso a paso los parámetros que tiene una marco que se repite en la trama siguiente superposiciones de
señal de audio, además de conocer sus diferentes etapas y que 25% y 50% son comunes. [2]
significa cada una de ellas. Se analizará con Matlab para estudiar
más a fondo cada uno de sus parámetros y los resultados de la
simulación.
Speech
Palabras Clave:. LPC, SPEECH, FILTER. No hay nada especial sobre el discurso de un audio en
perspectiva es simplemente como cualquier otro sonido, sólo
cuando la escuchamos que nuestros cerebros comienzan a
interpretar una determinada señal. [3] Aparte de este
I. INTRODUCCIÓN . comportamiento interpretativo del cerebro humano, hay
características de audio dentro de la música y otros sonidos
El procesamiento de audio incluye diferentes aplicaciones que son inherentemente discursos similares en sus
tecnológicas, como la reproducción de música en alta características espectrales y temporales Sin embargo el habla
fidelidad, el reconocimiento del habla o la síntesis del habla[1]. en sí, es un conjunto estructurado de sonidos continuos, en
Se pretende combinar una explicación teórica de los virtud de su mecanismo de producción. [4]
principales conceptos del procesamiento de audio y ver sus
aplicaciones más relevantes, con una vertiente práctica que Características del speech
permita lograr mejor algunos de los conceptos expuestos.
A pesar de que muchas diferencias entre los individuos, y la
Se propone entonces la identificación de algunos parámetros existencia de muchos idiomas, el habla sigue las pautas
espectrales que caracterizan y determinan la calidad de la voz, generales y en promedio tiene características únicas así como
de tal manera de lograr una mejor aproximación en la las de volumen, distribución de frecuencia, pitch rate and
clasificación de los mismos de acuerdo a sus propiedades, esto syllabic rate. [4]
se realizó a través de un análisis sistemático mediante técnicas Estas características se han adaptado con respecto a medio
de procesado digital de señales. Estas técnicas aplicadas a las ambiente, la audición y la producción de la voz limitaciones,
señales de voz digitalizada permitirán determinar las pero los rápidos cambios en la sociedad durante el siglo
propiedades espectrales. [1] Así se dispondrá de mayor pasado han superado nuestra capacidad de adaptación. [5]
información objetiva para la clasificación y determinación de El alfabeto fonético internacional (IPA) es la habitual método
la calidad de voz. para describir y escribir los diferentes fonemas que recuperan
el habla.
II. MARCO TEÓRICO Físicamente, los sonidos del habla pueden describirse en
términos de un contorno de tono y frecuencias de los
Segmentación formantes.
De hecho esta descripción constituye un método de análisis
Es necesaria no sólo porque 256 es un cómodo tamaño, pero utilizado por la mayoría de los algoritmos de compresión de
cuando cualquiera de las siguientes son verdaderas: voz
El audio es continua (es decir, no se puede esperar para una Formantes son frecuencias resonantes del tracto vocal que
muestra final llegue antes de comenzar el procesamiento) aparecer en el espectro de voz como picos claros.
La naturaleza de la señal de audio está cambiando Formantes se han descrito como la más sencilla característica
continuamente, o características a corto plazo son importantes importante en las comunicaciones de voz. [5]
El tratamiento aplicado a cada bloque de las escalas de forma
no lineal en complejidad (es decir, un bloque doble de grande
sería cuatro o incluso ocho veces más difícil para procesar). [2]
compresión, y lo ideal es no cambiar el sonido de cualquier
manera que no sea puramente cambiar su volumen. [5]
Filtro pre-enfasis.
Cuantización
Ilustración 2: cuantización
Ilustración 4: coeficientes LPC
Parametrizacion
El proceso de normalización de la señal, sirve para obtener Estalin Andrés Fuentes Salazar.
valores estándares en toda la onda, y obtener la ganancia del Nacido en Santo Domingo de los
mismo. Colorados, Santo Domingo de los
Tsáchilas-Ecuador, el 10 de Junio de
La parametrizacion de una señal nos sirve para identificar paso 1990. Educación básica cursada en la
a paso cada una de las características de las señales, y a su vez escuela “7 de Octubre” de la ciudad
poder variar los parámetros de acorde a lo que se desee de Santo Domingo de los Colorados.
estudiar y analizar. Estudios secundarios los realice en el
Instituto Técnico de Comercio “ITC
Los filtros aplicados para obtener el pitch y los coeficientes Amazonas”. Estudios superiores
son filtros de pre-énfasis, que eliminan las frecuencias altas de realizados en la Escuela Superior Politécnica de Chimborazo
la señal. obteniendo el título de Ingeniero en Electrónica,
Telecomunicaciones y Redes. Actualmente cursando la
El decodificador realiza el proceso inverso, para lograr Maestría en Sistemas de Telecomunicaciones.
recuperar la señal, aunque esta no es recuperada en un 100%,
hay distorsiones que son imperceptibles al oído humano.