You are on page 1of 16

Modelo de produccin

de la voz

Fontica y fonmica

Fonema: Unidad terica bsica para describir


cmo la voz transporta un significado
lingstico.
Sonido: Realizacin prctica de un fonema
Fonmica: Estudio de las unidades
abstractas (fonemas) y sus relaciones en una
lengua

Fontica y fonmica

Fontica: Estudio de los sonidos


reales:

Fontica articulatoria
Fontica acstica
Fontica auditiva

Alfonos: Representan pequeas


variaciones sobre cada fonema,
permitidas en cada lenguaje.

Sistema de produccin de la voz

rganos del sistema de


produccin de la voz:

Pulmones: Fuente
Laringe: Contiene las cuerdas
vocales
Cavidad farngea y cavidad
oral, agrupadas en el tracto
vocal
Cavidad nasal (tracto nasal)

Anatoma de la laringe

Las cuerdas vocales

Sistema de produccin de la voz


rganos:

Funcin:

Clasificacin del sonido

Segn el tipo de excitacin:

Sonoros: cuando las cuerdas vocales vibran.

Sordos: Cuando las cuerdas vocales no vibran.

Ejemplos: /s/

Oclusivos: Cuando se interpone un obstculo al


flujo del aire, que desaparece de pronto.

Ejemplos: /a/, /e/, etc.

Ejemplos: /b/, /p/, /t/

Combinaciones de los anteriores

Ejemplos: /z/ en cebras

Formantes

Son resonancias producidas en las cavidades


de los rganos de produccin
Las frecuencias a las que se producen los
formantes dependen de:

Longitud total del tracto farngeo-oral


Posicin de los estrechamientos o constricciones
en el tracto
Grado de estos estrechamientos

Ejemplo: vocales
/i/
/a/
/o/
/a/ cerrada
/u/
/e/

Formantes

Reglas que relacionan las frecuencias de los


formantes y las caractersticas del tracto
vocal:

La frecuencia de F1 es proporcional al
estrechamiento en la mitad frontal del tracto vocal
La frecuencia de F1 se eleva al estrechar la
faringe
La frecuencia de F2 disminuye con las
constricciones producidas por la lengua
La frecuencia de todos los formantes disminuye
con la constriccin formada por los labios.

Clasificacin de vocales

Modo de articulacin (formante 1)

Cerradas (i, u)
Medias (e, o)
Abiertas (a)

Lugar de articulacin (formante 2)

Anteriores (i, e)
Centrales (a)
Posteriores (o, u)

Tringulo voclico
3000

freq. 2o
formante (Hz)

2500
2000

/i/

/e/

/u/

/o/

1500
1000
500

/a/

200 300 400 500 600 700 800 9001000

freq. 1er formante (Hz)

Pronunciacin de vocales

Semivocales y consonantes

Semivocales:

Constituido por el grupo /w/, /l/, /r/, /y/

Consonantes:

Representan sonidos producidos con un mayor grado de


constriccin que las vocales.
Pueden producirse con cualquier tipo de excitacin: sorda,
sonora, etc.
Se clasifican en:
Oclusivas
Fricativas
Nasales

Clasificacin de las consonantes

Segn el modo de
articulacin:

Oclusivas: (b, d, g, p, t, k)
Fricativas: (s, f, z, x, y,)
Africadas: (ch)
Nasales: (m, n, )
Lquidas:
Laterales (l, ll)
Vibrantes (r, R)

Segn el lugar de
articulacin:

Bilabiales (b, p, m)
Labiodentales (f)
Linguodentales (t, d)
Linguointerdentales (z)
Linguoalveolares (s, n, l, r, R)
Linguopalatares (y, ch, , ll)
Linguovelares (k, g, x)

Ejemplo: consonantes sonoras


/m/
/l/
/n/
/y/
//
/R/

Ejemplo: consonantes fricativas

Fonemas del espaol

Algunas curiosdades (I)

10

Algunas curiosidades (II)

La seal de voz

La seal de voz se puede ver como un


proceso estocstico no estacionario.
Caractersticas bsicas:

Ancho de banda principal: 4 kHz


Pronunciacin de fonemas: 4 a 20 por segundo
Tiempo mnimo de duracin de un fonema: 50 ms
Tiempo de consideracin de seal estacionaria
(por convenio): 20ms

11

La seal de voz

La seal de voz

12

Modelo del tracto vocal

Suponemos:

Que el sonido se propaga en el tracto en una sola


direccin. Los tejidos blandos evitan la
propagacin radial.
Que las ondas sonoras son ondas planas que se
propagan desde la glotis a los labios.
Que el tracto vocal se puede modelar por una
serie de tubos acsticos de paredes duras y sin
prdidas.

Modelo del tracto vocal

13

Modelo del tracto vocal

La funcin de transferencia glotal se puede modelar


como un filtro todo polos:
H(z) =

G
p

1+ # ak z"k
k=1

Podemos modelar por tanto la seal de voz como:


p

s[n] = G x[n] " # ak s[n " k]


k=1

%Ruido blanco y gaussiano Voz sonora


'
1
x[n] = &
Voz sorda
$" [ n # r N 0 ]
N0 r
('

!
!

Modelo del tracto vocal

Con todo lo anterior, podemos elegir el conjunto de


coeficientes ak que minimicen:
p
$
'
E = # & s[n] + # ak s[n " k])
(
n="* %
k=1
*

Derivando e igualando a cero, obtenemos un sistema


!
de ecuaciones
con el que es posible obtener los
parmetros ak.

14

Modelo de produccin

Voz:

Aire producido en los pulmones


Si el sonido es sonoro, es modulado por las cuerdas vocales, que vibran a
la frecuencia fundamental (pitch)
Modificado por el tracto vocal
En sonidos nasales una parte del aire fluye por orificios nasales

Modelo de pulso glotal

15

Codificador LPC-10
Codificador

Anlisis:
Decisin sonoro/sordo
Pitch (slo sonoro)
Potencia de seal
(Ganancia)
Parmetros del filtro

Voz Original

Decodificador

Pitch
Tren de impulsos

Potencia de seal
V/U
G

Modelo del
tracto

Voz sinttica
Ruido aleatorio

Codificador LPC-10

Utiliza tramas de 180 muestras (44.44 tramas/segundo para fs=8.000


Hz y 16 bits por muestra)
El rgimen binario final es de 2,4 kbps (54 bits por trama):
El pitch se codifica con 7 bits.

La decisin sordo-sonoro se realiza con la tasa de cruces por cero y se


codifica con un solo bit.
La ganancia del modelo se codifica con 5 bits
Se calculan y transmiten 10 coeficientes de reflexin para una trama
catalogada como sonora
Los dos primeros se codifican como parmetros LARs con cinco bits cada
uno.
El resto se codifican linealmente

Descrito en: Federal Standard 1015, Telecommunications: Analog to


Digital Copnversion of Radio Voice By 2400 Bit/Second Linear
Predictive Coding, National Communication System, Office Technology
and Standards, Nov. 1984

16

You might also like