2 ModeloVoz

Modelo de produccin
de la voz
Fontica y fonmica
Fonema: Unidad terica bsica para describir

cmo la voz transporta un significado
lingstico.
Sonido: Realizacin prctica de un fonema
Fonmica: Estudio de las unidades
abstractas (fonemas) y sus relaciones en una
lengua
Fontica y fonmica
Fontica: Estudio de los sonidos

reales:
Fontica articulatoria
Fontica acstica
Fontica auditiva
Alfonos: Representan pequeas

variaciones sobre cada fonema,
permitidas en cada lenguaje.
Sistema de produccin de la voz
rganos del sistema de

produccin de la voz:
Pulmones: Fuente
Laringe: Contiene las cuerdas
vocales
Cavidad farngea y cavidad
oral, agrupadas en el tracto
vocal
Cavidad nasal (tracto nasal)
Anatoma de la laringe
Las cuerdas vocales
Sistema de produccin de la voz

rganos:
Funcin:
Clasificacin del sonido
Segn el tipo de excitacin:
Sonoros: cuando las cuerdas vocales vibran.
Sordos: Cuando las cuerdas vocales no vibran.
Ejemplos: /s/
Oclusivos: Cuando se interpone un obstculo al

flujo del aire, que desaparece de pronto.
Ejemplos: /a/, /e/, etc.
Ejemplos: /b/, /p/, /t/
Combinaciones de los anteriores
Ejemplos: /z/ en cebras
Formantes
Son resonancias producidas en las cavidades

de los rganos de produccin
Las frecuencias a las que se producen los
formantes dependen de:
Longitud total del tracto farngeo-oral

Posicin de los estrechamientos o constricciones
en el tracto
Grado de estos estrechamientos
Ejemplo: vocales
/i/
/a/
/o/
/a/ cerrada
/u/
/e/
Formantes
Reglas que relacionan las frecuencias de los

formantes y las caractersticas del tracto
vocal:
La frecuencia de F1 es proporcional al
estrechamiento en la mitad frontal del tracto vocal
La frecuencia de F1 se eleva al estrechar la
faringe
La frecuencia de F2 disminuye con las
constricciones producidas por la lengua
La frecuencia de todos los formantes disminuye
con la constriccin formada por los labios.
Clasificacin de vocales
Modo de articulacin (formante 1)
Cerradas (i, u)
Medias (e, o)
Abiertas (a)
Lugar de articulacin (formante 2)
Anteriores (i, e)
Centrales (a)
Posteriores (o, u)
Tringulo voclico
3000
freq. 2o
formante (Hz)
2500
2000
/i/
/e/
/u/
/o/
1500
1000
500
/a/
200 300 400 500 600 700 800 9001000
freq. 1er formante (Hz)
Pronunciacin de vocales
Semivocales y consonantes
Semivocales:
Constituido por el grupo /w/, /l/, /r/, /y/
Consonantes:
Representan sonidos producidos con un mayor grado de

constriccin que las vocales.
Pueden producirse con cualquier tipo de excitacin: sorda,
sonora, etc.
Se clasifican en:
Oclusivas
Fricativas
Nasales
Clasificacin de las consonantes
Segn el modo de
articulacin:
Oclusivas: (b, d, g, p, t, k)
Fricativas: (s, f, z, x, y,)
Africadas: (ch)
Nasales: (m, n, )
Lquidas:
Laterales (l, ll)
Vibrantes (r, R)
Segn el lugar de
articulacin:
Bilabiales (b, p, m)
Labiodentales (f)
Linguodentales (t, d)
Linguointerdentales (z)
Linguoalveolares (s, n, l, r, R)
Linguopalatares (y, ch, , ll)
Linguovelares (k, g, x)
Ejemplo: consonantes sonoras

/m/
/l/
/n/
/y/
//
/R/
Ejemplo: consonantes fricativas
Fonemas del espaol
Algunas curiosdades (I)
10
Algunas curiosidades (II)
La seal de voz
La seal de voz se puede ver como un

proceso estocstico no estacionario.
Caractersticas bsicas:
Ancho de banda principal: 4 kHz

Pronunciacin de fonemas: 4 a 20 por segundo
Tiempo mnimo de duracin de un fonema: 50 ms
Tiempo de consideracin de seal estacionaria
(por convenio): 20ms
11
La seal de voz
La seal de voz
12
Modelo del tracto vocal
Suponemos:
Que el sonido se propaga en el tracto en una sola

direccin. Los tejidos blandos evitan la
propagacin radial.
Que las ondas sonoras son ondas planas que se
propagan desde la glotis a los labios.
Que el tracto vocal se puede modelar por una
serie de tubos acsticos de paredes duras y sin
prdidas.
13
La funcin de transferencia glotal se puede modelar

como un filtro todo polos:
H(z) =
G
p
1+ # ak z"k
k=1
Podemos modelar por tanto la seal de voz como:

p
s[n] = G x[n] " # ak s[n " k]

k=1
%Ruido blanco y gaussiano Voz sonora

'
1
x[n] = &
Voz sorda
$" [ n # r N 0 ]
N0 r
('
!
!
Con todo lo anterior, podemos elegir el conjunto de

coeficientes ak que minimicen:
p
$
'
E = # & s[n] + # ak s[n " k])
(
n="* %
k=1
*
Derivando e igualando a cero, obtenemos un sistema

!
de ecuaciones
con el que es posible obtener los
parmetros ak.
14
Modelo de produccin
Voz:
Aire producido en los pulmones

Si el sonido es sonoro, es modulado por las cuerdas vocales, que vibran a
la frecuencia fundamental (pitch)
Modificado por el tracto vocal
En sonidos nasales una parte del aire fluye por orificios nasales
Modelo de pulso glotal
15
Codificador LPC-10
Codificador
Anlisis:
Decisin sonoro/sordo
Pitch (slo sonoro)
Potencia de seal
(Ganancia)
Parmetros del filtro
Voz Original
Decodificador
Pitch
Tren de impulsos
Potencia de seal
V/U
G
Modelo del
tracto
Voz sinttica
Ruido aleatorio
Codificador LPC-10
Utiliza tramas de 180 muestras (44.44 tramas/segundo para fs=8.000

Hz y 16 bits por muestra)
El rgimen binario final es de 2,4 kbps (54 bits por trama):
El pitch se codifica con 7 bits.
La decisin sordo-sonoro se realiza con la tasa de cruces por cero y se

codifica con un solo bit.
La ganancia del modelo se codifica con 5 bits
Se calculan y transmiten 10 coeficientes de reflexin para una trama
catalogada como sonora
Los dos primeros se codifican como parmetros LARs con cinco bits cada
uno.
El resto se codifican linealmente
Descrito en: Federal Standard 1015, Telecommunications: Analog to

Digital Copnversion of Radio Voice By 2400 Bit/Second Linear
Predictive Coding, National Communication System, Office Technology
and Standards, Nov. 1984
16

2 ModeloVoz

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

2 ModeloVoz

Uploaded by

Copyright:

Available Formats

Modelo de produccin

Fonema: Unidad terica bsica para describir

Fontica: Estudio de los sonidos

Alfonos: Representan pequeas

Sistema de produccin de la voz

rganos del sistema de

Las cuerdas vocales

Sistema de produccin de la voz

Clasificacin del sonido

Segn el tipo de excitacin:

Sonoros: cuando las cuerdas vocales vibran.

Sordos: Cuando las cuerdas vocales no vibran.

Oclusivos: Cuando se interpone un obstculo al

Ejemplos: /a/, /e/, etc.

Ejemplos: /b/, /p/, /t/

Combinaciones de los anteriores

Ejemplos: /z/ en cebras

Son resonancias producidas en las cavidades

Longitud total del tracto farngeo-oral

Reglas que relacionan las frecuencias de los

Modo de articulacin (formante 1)

Lugar de articulacin (formante 2)

200 300 400 500 600 700 800 9001000

freq. 1er formante (Hz)

Constituido por el grupo /w/, /l/, /r/, /y/

Representan sonidos producidos con un mayor grado de

Clasificacin de las consonantes

Ejemplo: consonantes sonoras

Ejemplo: consonantes fricativas

Fonemas del espaol

Algunas curiosdades (I)

Algunas curiosidades (II)

La seal de voz se puede ver como un

Ancho de banda principal: 4 kHz

Modelo del tracto vocal

Que el sonido se propaga en el tracto en una sola

Modelo del tracto vocal

Modelo del tracto vocal

La funcin de transferencia glotal se puede modelar

Podemos modelar por tanto la seal de voz como:

s[n] = G x[n] " # ak s[n " k]

%Ruido blanco y gaussiano Voz sonora

Modelo del tracto vocal

Con todo lo anterior, podemos elegir el conjunto de

Derivando e igualando a cero, obtenemos un sistema

Aire producido en los pulmones

Modelo de pulso glotal

Utiliza tramas de 180 muestras (44.44 tramas/segundo para fs=8.000

La decisin sordo-sonoro se realiza con la tasa de cruces por cero y se

Descrito en: Federal Standard 1015, Telecommunications: Analog to

You might also like