Luciana Mara Oliveira

Determinao dos Limiares de Normalidade dos
Parmetros Acsticos da Voz
Luciana Mara de Oliveira Andrade
Dissertao apresentada ao Programa de PsGraduao Interunidades em Bioengenharia /

Escola de Engenharia de So Carlos /
Faculdade de Medicina de Ribeiro Preto /
Instituto de Qumica de So Carlos, da
Universidade de So Paulo para obteno do
ttulo de Mestre em Bioengenharia.
ORIENTADOR: Prof. Dr. Marcos Grellet
So Carlos SP
2003
Dedico este trabalho a DEUS que em

sua infinita Bondade permitiu que mais
esta etapa da minha vida fosse
concluda.
AGRADECIMENTOS
Ao Prof. Dr. Marcos Grellet pela dedicao e orientao, sem as quais no

seria possvel realizar este sonho.
Ao Prof. Dr. Jos Carlos Pereira pela imensa colaborao, pacincia,
confiana e ensinamentos no s para a realizao deste trabalho, mas tambm como
exemplo de vida.
Ao Dr. Marcelo de Oliveira Rosa por suas sugestes e esclarecimentos.
Ao Dr. Orivaldo Lopes da Silva pelo incentivo e conhecimentos transmitidos.
Aos amigos Par, Granato, Maira e Mori pelo companherismo e acolhida no
laboratrio LIM.
Daniel Espanhol Razera pela amizade, ajuda e sugestes que tanto
contriburam para a concretizao deste trabalho.
Jussara Melo Vieira pela inestimvel amizade conquistada.
Paula Carvalho Viana pelo apoio e incentivo.
Aos meus pais Aulus e Ana, minha irm Rose e meu futuro sobrinho Enzo pelo
incentivo e confiana.
Ao Departamento de Otorrinonalingologia da Faculdade de Medicina de
Ribeiro Preto/ Universidade de So Paulo.
Fapesp pela concesso de auxlio financeiro para o desenvolvimento deste
trabalho.
todos que direta ou indiretamente contriburam para a realizao deste feito.
SUMRIO
LISTA DE FIGURAS
LISTA DE TABELAS
II
LISTA DE ABREVIATURAS
III
LISTA DE SMBOLOS
RESUMO
ABSTRACT
VI
VII
1 INTRODUO
2 OBJETIVOS
3 REVISO DE LITERATURA
3.1 VOZ
3.2 PRODUO VOCAL
3.3 ANATOMIA VOCAL
3.4 FUNES DA LARINGE
12
3.4.1 Funo Respiratria
12
3.4.2 Funo Deglutitria
13
3.4.3 Funo Fonatria
13
3.5 ANATOMIA DAS PREGAS VOCAIS
13
3.6 VIBRAO DAS PREGAS VOCAIS
14
3.6.1 Freqncia Fundamental
17
3.6.2 Intensidade Vocal
18
3.6.3 Qualidade Vocal
18
3.7 PARMETROS ACSTICOS
20
3.7.1 Parmetros Acsticos no Domnio do Tempo
21
3.7.2 Parmetros Acsticos no Domnio da Freqncia
24
4 METODOLOGIA
31
5 RESULTADOS E DISCUSSO
34
6 CONCLUSES
45
7 REFERNCIAS BIBLIOGRFICAS
46
LISTA DE FIGURAS
Figura 1: Posicionamento das pregas vocais
Figura 2: Esqueleto da Laringe
10
Figura 3: Sinal vocal no domnio do tempo
20
Figura 4: Sinal vocal no domnio da freqncia
21
Figura 5: Histograma da freqncia fundamental do sexo masculino
35
Figura 6: Histograma da freqncia fundamental do sexo feminino
36
Figura 7: Histograma do jitter
37
Figura 8: Histograma do shimmer
38
Figura 9: Histograma do SFR
39
Figura 10: Histograma do SFF
40
Figura 11: Histograma do P.A
41
Figura 12: Resduo de voz normal para o PA
42
Figura 13: Resduo de voz patolgica para o PA
42
Figura 14: Histograma do EX
43
II
LISTA DE TABELAS
Tabela 1: Tabela com anlise estatstica
44
Tabela 2: Tabela comparativa de resultados
44
III
LISTA DE ABREVIATURAS
APQ - Quociente de perturbao de amplitude
Br - Razo de soprosidade
BRI - ndice soprosidade
CPP - Proeminncia de pulso cepstral
Et al - Colaboradores
EX - Coeficiente de excesso
F0 - Freqncia fundamental
Fc - Limiar de alta freqncia
FFT - Espectro por Transformao de Fourier
FPQ - Quociente de perturbao de freqncia
H/L - Razo da mdia da energia espectral menor que 4 kHz e maior/igual que 4 kHz
H1A - Relao entre o 1. harmnico e o 2. harmnico
HFPR - Relao de potncia em altas freqncias
HNR - Razo harmnico/rudo
Hr - Intensidade harmnica relativa
LTAS - Espectro mdio de longo termo
NNE - Energia do rudo normalizado
P/A - Relao entre a amplitude de pico pela amplitude mdia do valor absoluto do sinal
PA - Amplitude da autocorrelao do sinal residual
PFF - Fator de perturbao de pitch
PPQ - Quociente de perturbao do perodo de freqncia
ppvv - Pregas vocais
Ra - Razo da energia dos harmnicos
RAP - Perturbao mdia relativa da freqncia
IV
RPK - Pearson r no pico de autocorrelao

S/N - Razo sinal/rudo
SFF - Suavidade espectral do filtro inverso
SFR - Suavidade espectral do sinal residual
Tp - Perodo fundamental mdio
LISTA DE SMBOLOS
/a/ - Vogal a
/e/ - Vogal e
/i/ - Vogal i
dB - Decibis
Gb - Gigabyte
Hz - Hertz
Mb - Megabyte
p Nvel de Significncia do Teste Estatstico
VI
RESUMO
Existe uma gama de pesquisas destinada anlise digital da voz, cujo intento o
de propiciar ferramentas que possam auxiliar no processo diagnstico e teraputico. O
intercmbio entre engenharia e reas da sade, como medicina e fonoaudiologia, tem
apresentado expansiva importncia para um melhor entendimento e aprimoramento de
um saber mais comum, onde a aplicabilidade de dados quantitativos associados a
dados qualitativos acresce conhecimentos nestas duas vertentes.
O intuito deste trabalho o de utilizar dados quantitativos atravs de uma
ferramenta de anlise acstica da voz e avaliar sua acuracidade. Para tanto, fez-se
exames clnicos e avaliaes perceptivas em 130 voluntrios.
Os resultados obtidos conjuminam com a proposio deste estudo, sendo
expressivamente promissores com a exatido da inter-relao dos achados, com o qual
pode-se concluir a veracidade da ferramenta utilizada.
VII
ABSTRACT
The diagnosis and therapeutic process of the voice has incorporated digital voice
analysis as a useful tool for the specialists.
The interchange between engineering and health sciences has improved the
understanding of this interface area and the association between quantitative data and
qualitative evaluation enhanced both.
The purpose of this work is to use the acoustical analysis of voice in order to
evaluate how accurate is that tool compared with clinical and perceptual diagnostics. A
set of 130 subjects was used to evaluate this comparison.
The results are consistent and match favorably the clinic and perceptual
achievements.
1 INTRODUO
Para poder discorrer sobre a voz, faz-se necessrio situ-la enquanto elemento de
relevada importncia no processo de comunicao humana, visto que, um componente
da linguagem oral e , tambm, um dos principais vnculos do relacionamento entre as
pessoas.
A voz tem origem na laringe, ou seja, na vibrao das pregas vocais, decorrente
da passagem do fluxo areo originado nos pulmes. Esta voz, ento produzida, possui
caractersticas prprias que variam de acordo com o sexo, a pessoa e com a faixa etria,
alm de refletir o estado e o comportamento larngeos, caracterizando o que se chama
de qualidade vocal. Assim, v-se que pela qualidade vocal, pode-se conhecer e/ou
inferir sobre as condies antomo-fisiolgicas das estruturas larngeas.
Devido complexidade da voz, as avaliaes subjetiva e objetiva so
importantes para descrev-la. Essas avaliaes podem ser utilizadas como meio de
auxlio no diagnstico e no tratamento das doenas que acometem a laringe.
Alm de ser a primeira ferramenta de um clnico, a avaliao perceptivo-auditiva
vocal, ou seja, aquela realizada subjetivamente, fundamental e insubstituvel por ser a
mais acessvel e no necessitar de aparatos. O que no descarta a importncia das
avaliaes objetivas, pois estas se complementam com as subjetivas dando mais
consistncia s constataes clnicas. Para isto, o confronto de achados perceptivos e
acsticos faz-se necessrio, estabelecendo-se, portanto, em casos em que ambos no
direcionam para o mesmo diagnstico, um falso positivo, quando o referencial subjetivo

no detecta problemas vocais e a anlise acstica o acusa. O contrrio tambm pode
acontecer, ou seja, auditivamente perceber-se alterao vocal e a anlise acstica no
detectar problemas vocais, gerando-se um falso negativo.
Diante disto, estudos para aprimoramento dos programas de anlise acstica
assumem grande destaque para o clnico, principalmente por induzirem a um
aprofundamento no conhecimento das caractersticas objetivas da voz.
2 OBJETIVOS
Determinar os valores mdios dos parmetros acsticos da voz: jitter, shimmer,

suavidades espectrais do filtro e do sinal residual, o ndice de vocalizao e o
coeficiente de excesso.
Avaliar as taxas de falso positivo e falso negativo da ferramenta de anlise
acstica da voz, atravs da inspeo videoestroboscpica e avaliao perceptivoauditiva.
3 REVISO DE LITERATURA
3.1 VOZ
A avaliao subjetiva da voz iniciou-se no sculo XIX e essencial ao

fonoaudilogo, o qual, utiliza-se deste instrumento para avaliao e posterior
reabilitao do sujeito. Nesta avaliao, o treinamento e a sensibilidade do especialista
se faz mister, pois o mesmo capaz de detectar e reconhecer alteraes vocais devido
habilidade desenvolvida atravs do treinamento de sua audio, e a sensibilidade para
perceber se tais alteraes no esto intrinsecamente ligadas ao seu estado emocional
momentneo.
A voz o resultado de fenmenos fisiolgicos que, juntos, determinam a
emisso acstica, o que subsidia a objetividade no que tange voz. Anlises, so
realizadas em diferentes domnios Nieto (1995), para discriminar as diferentes
particularidades da voz. A avaliao objetiva dos vrios aspectos da voz como por
exemplo medidas de perturbao em amplitude e freqncia permite uma quantificao
da mesma propiciando, desta forma, a determinao de alteraes na voz que podem
ocorrer ao longo do tempo e mudanas resultantes de intervenes. Assim como o
audiograma auxilia o especialista nos diagnsticos e tratamento de possveis disacusias,
um teste objetivo da voz pode auxiliar no diagnstico de disfonias (ROSA et al., 1999).
Devido natureza numrica, so permitidas a documentao e a comparao entre
resultados. Nota-se que a evoluo da tecnologia propicia uma apurao bem mais
minuciosa das alteraes na voz.
Para melhor diagnosticar alteraes vocais, existe uma mirade de ferramentas e
pesquisas disponveis, que devem ser utilizadas por especialistas que tratam da voz.
Mais que interesse cientfico, o foco do clnico est no aprimoramento dos resultados do
diagnstico e do tratamento. Pelo uso seletivo de medidas relevantes, estas podem ser
usadas como realimentao na melhoria de tcnicas de tratamento.
Dentre as ferramentas, a anlise acstica da voz, devido a sua objetividade, tem
expressiva utilizao. A evoluo histrica da mesma, descrita em dcadas, facilita a
compreenso dos fatos marcantes (BOONE E MACFARLANE, 1988). Seu
desenvolvimento se deve, em grande parte, evoluo da tecnologia atravs dos estudos
no campo da Engenharia.
Na dcada de 20, a anlise acstica da voz era realizada utilizando oscilogramas
por meio da visualizao de ondas ou grficos de amplitude pelo tempo.
Na dcada de 40, iniciou-se a utilizao da Anlise de Fourier com Anlise de
Henrici para obteno da anlise espectral.
Na dcada de 50, o Espectrgrafo surgiu revolucionando a metodologia de
anlise da voz atravs do espectrograma que uma gravao visual tridimensional da
distribuio de energia em freqncia, tempo e intensidade.
Na dcada de 70, o processamento digital de sinais revolucionou o estudo da voz
Os programas permitiram anlises combinadas no domnio do tempo e da freqncia.
Foram
produzidos
os
Espectrogramas
Digitais
Programas
de
Anlise
Computadorizados da Voz.
Davis (1979), coloca que a avaliao perceptivo-auditiva da voz fornece
informaes sobre a qualidade vocal, visto que, patologias larngeas so acompanhadas
freqentemente por mudanas na mesma. No entanto, esta avaliao pode receber

crticas devido sua subjetividade.
A anlise acstica do sinal vocal promissora e vem sendo mais utilizada com a
evoluo da tecnologia digital, acrescentando dados avaliao e ao diagnstico. Sua
associao com mtodos de imagem como laringoscopias e estroboscopias aumenta o
grau de preciso do diagnstico.
A maioria dos trabalhos realizados com amostras vocais utiliza equipamentos
analgicos para gravao da voz em fita magntica, para posterior utilizao em estudos
no computador. Holmes (1975), analisou a gravao analgica em meio magntico e
verificou que mesmo gravadores analgicos de boa qualidade provocam distores de
fase nas baixas freqncias do sinal gravado. Assim mais interessante a utilizao de
gravao vocal direta em equipamento digital.
Segundo Rosa (1998), a voz do paciente pode ser captada com uso de
microfones tipo cardiide e tipo acelermetro. O microfone cardiide ou convencional,
mais difundido e para melhor definio deve ser unidirecional, com ganho dinmico e
larga faixa de resposta em freqncia. O microfone acelermetro ou de contato, capta
atravs da pele a vibrao da glote, no influenciado pela supra-glote, mas pelas
camadas do pescoo que atenuam o sinal captado.
Krom (1994), cita que nas tcnicas de anlise acstica da voz, o sinal vocal pode
ser analisado com estabilidade usando vogais sustentadas. A preferncia por vogais
sustentadas devida a maior facilidade de controle e padronizao da produo da
fonao e menor atuao da articulao do que na fala contnua.
Os sinais de voz apresentam diferenas de energia sonora entre as pores inicial
e final dos trechos voclicos devido ao ataque do fluxo de ar pela glote e perda de
capacidade volumtrica de ar, respectivamente, sendo necessrio definir o trecho
voclico do sinal digitalizado e eliminar os trechos no voclicos. Krom (1995),

mostrou que estes intervalos no sinal vocal produzem maior perturbao em amplitude e
freqncia, o que pode caracterizar apenas uma condio de energia acstica do fluxo
de ar e no uma evidncia patolgica. Em decorrncia de tal fato, devem ser
desconsiderados esses dois momentos (inicial e final) padronizando o tamanho da
amostra vocal.
Para melhor compreenso dos programas existentes, destinados anlise de voz,
se faz necessrio distino entre os domnios temporal e frequencial (NIETO et al.,
1995).
A anlise de voz no domnio do tempo relacionada representao grfica da
onda sonora em relao s variaes de presso sonora ao longo do tempo. Neste
domnio foram obtidas as formas da onda, anlise de Freqncia Fundamental, do jitter
e do shimmer.
A anlise de voz no domnio da freqncia relacionada representao grfica
das variaes da amplitude das componentes espectrais distintas que compem a voz.
Neste domnio foram obtidos o Espectrograma, o Espectro por Transformao de
Fourier (FFT), traado de formantes, anlise de componentes harmnicas e anlise de
freqncia fundamental.
3.2 PRODUO VOCAL

Por no existir um nico orgo destinado produo vocal, faz-se necessrio a
ao integrada e harmoniosa de uma srie de sistemas, que participam ativamente no
processo de vocalizao. Dentre os vrios sistemas envolvidos, pode-se destacar o
sistema respiratrio, adaptado a partir da respirao vital, tornando-se passiva na

inspirao e ativo na expirao.
A voz produzida pelo fluxo de ar expiratrio que advm dos pulmes e passa
pelas pregas vocais (Figura 1), as quais so encontradas aproximadas colocando-as em
vibrao. A freqncia de vibrao determinada pela elasticidade ou tenso que as
pregas vo apresentar durante a produo do som, o que indicado pelo alongamento e
espessura das mesmas. Assim sendo, quanto mais rpido elas vibrarem (freqncia alta),
mais aguda a altura percebida da voz. A intensidade da vocalizao ou a intensidade
percebida da voz determinada pelo vigor em que as pregas vocais vibram.
Figura 1: Posicionamento das pregas vocais durante a produo vocal (A) e durante a respirao (B)
(adaptao de http://www.gastroweb.com.br/imgend/laringe.htm, acessado em 12/04/03)
Os sons voclicos so produzidos por pulsos de ar quase peridicos gerados na

laringe pelo movimento cclico das pregas vocais que excitam o trato vocal (/a/, /e/, /i/
/o/, /u/). H, ainda, os sons fricativos produto da passagem turbulenta de ar atravs de
alguma constrio formada no trato vocal (/f/, /v/) e os sons plosivos, que so aqueles
produzidos pelo fechamento completo do trato vocal com conseqente aumento da
presso anterior obstruo e liberao abrupta desta (/d/, /t/, /p/, /b/).
Assim, v-se que a voz uma forma inteligvel de som, a qual produto de uma
excitao (gerador) e dos efeitos ressonantes do trato vocal (filtro).
Dos trs modos supra citados, os sons voclicos so os que apresentam, durante
a vibrao das pregas vocais, caractersticas ressonantais completa do trato vocal.
Portanto, do ponto de vista de anlise do aparato vocal, este modo de gerao de voz
contm toda a informao fisiolgica sobre o sistema.
3.3 ANATOMIA VOCAL

H oito msculos extrnsecos na laringe, sendo quatro abaixo do osso hiide e
quatro acima dele. Por isso so divididos em dois grupos: supra-hiides (digstrico,
gnio-hiideo, milo-hiideo e estilo-hiideo) e infra-hiides (tiro-hiideo, esternohiideo, omo-hiideo e esternotireideo). Todos os msculos extrnsecos tm suas
fixaes larngeas a partir do osso hiideo. As fixaes fora da laringe incluem vrias
estruturas, tais como a mandbula, mastide e estruturas do trax.
No grupo supra-hiideo, os msculos digstrico (ventre anterior), o gniohiideo e o milo-hiideo, quando contrados,
puxam o
osso
hiideo,
conseqentemente a laringe, para frente. O ventre posterior do digstrico e do estilohiideo quando contrados puxam o hiideo posteriormente.
No grupo infra-hiideo os msculos esternotireideo, esterno-hiideo e o omohiideo, quando contrados, puxam a laringe para baixo. O msculo tiro-hiideo
contribui para determinar o ngulo da cartilagem tireidea com relao cartilagem
cricidea.
Segundo Dngelo e Fattini (1995), a ao dos msculos supra-hiideos com os
infra-hiideos mantm o osso hiideo, propiciando uma base firme para os movimentos
da lngua.
O esqueleto da laringe (Figura 2) composto de cartilagem hialina, sendo as
mais importantes s cartilagens tireideas, cricidea e aritenideas.
10
Epiglote
Osso Hiideo
Ligamento Tireohiideo
Osso Hiideo
Ligamento Tireohiideo
Epiglote
Cartilagem Tireidea
Cartilagem Tireidea
Cartilagem Cricidea
Cartilagens Aritenideas,
Cuneiformes e
Corniculadas
LARINGE
Figura 2: Esqueleto da Laringe

(adaptao de http://www.corpohumano.hpg.ig.com.br/respiracao/laringe/laringe.html, acessado em
12/04/03)
A tireidea a maior cartilagem da laringe e composta por duas lminas

unidas ao meio. Zemlin (1998), coloca que esse ngulo nos homens de
aproximadamente 80 e nas mulheres de 90, aproximadamente.
A cricidea a segunda maior cartilagem larngea. A cartilagem tireidea
articula-se com a cricidea sobre sua superfcie pstero-lateral, permitindo assim,
movimento de rotao e um leve movimento ntero-posterior.
H duas cartilagens aritenideas, cada uma posicionada sobre um lado da linha
mdia, sobre a superfcie supraposterior da cartilagem cricidea. A base horizontal da
cartilagem aritenidea, que se articula com a cricidea, cncava.
Segundo Vonleden e Moore (1961), movimento de rotao ocorre devido
forma dessas superfcies.
Na base de cada cartilagem aritenidea encontramos trs ngulos. O mais
anterior projeta-se para dentro da laringe e chamado de processo vocal, sendo o ponto
de fixao posterior da prega vocal; o ngulo pstero-lateral projeta-se para fora da
laringe e recebe o nome de processo muscular por ser o local de fixao de vrios
msculos, tais como o cricoaritenideo posterior, abdutor da laringe, e o
cricoaritenideo lateral, adutor da regio anterior das ppvv; o ngulo pstero-lateral no
recebe nenhum nome.
11
A epiglote uma cartilagem em forma de folha fixada sobre a superfcie mesial

da cartilagem tireidea na juno das duas lminas tireideas (Figura 2). Essa
cartilagem auxilia no direcionamento de lquidos e alimentos ao esfago durante a
deglutio. Na fonao, ela se movimenta durante a produo de diferentes vogais e
consoantes, podendo dificultar a visualizao das pregas vocais. Entretanto, durante a
produo das vogais /i/ e /u/, onde a posio lingual resulta no movimento da epiglote
para frente, a visualizao das pregas vocais permitida.
H cartilagens remanescentes como as corniculadas e as cuneiformes (Figura 2),
as primeiras formam o pice da aritenidea e as segundas so encontradas dentro da
prega ariepigltica.
So cinco msculos intrnsecos da laringe, cujas fixaes encontram-se
associadas a estruturas dentro da laringe.
O msculo aritenideo tem duas partes e posiciona-se entre as duas cartilagens
aritenideas. Uma parte consiste de fibras musculares que percorrem uma direo
horizontal. A outra parte consiste de fibras que correm a partir da base de uma
aritenidea at o pice da outra aritenidea. O efeito conjunto promove a aduo das
aritenideas e fecham a via area posterior extrema.
O msculo cricoaritenideo lateral pareado, percorrendo os lados e a superfcie
superior da cartilagem cricidea para o processo muscular da aritenidea. Esse msculo
puxa o processo muscular anteriormente, balanando a cartilagem aritenidea
medialmente e aduzindo as prprias pregas vocais. Os msculos aritenideo e o
cricoaritenideo lateral funcionam juntos para aduzir as pregas vocais.
O cricoaritenideo posterior o nico que abduz as pregas vocais, pois um
movimento de curta durao de seus movimentos rapidamente abduz as pregas vocais o
suficiente para cessar sua vibrao.
12
O msculo cricotireideo possui formato de leque e localiza-se entre as

cartilagens cricidea e tireidea. Sua funo consiste em: diminuir o espao entre a
tireidea e a cricidea; aumentar a distncia entre as cartilagens tireidea e aritenidea;
aumentar o comprimento das pregas vocais; diminuir sua massa; e aumentar sua tenso,
bem como a freqncia vocal.
O msculo tiroaritenideo compe o corpo das pregas vocais e par, cada um
deles com a forma de um grosso feixe, originam-se no ngulo da cartilagem tireidea e
insero principalmente no processo vocal. A ao deste msculo encurtar e aduzir as
ppvv, diminuindo a distncia entre as cartilagens aritenideas e tireidea, tornando-se
um feixe mais largo e reduzindo a freqncia da voz gerada.
3.4 FUNES DA LARINGE

A laringe possui vrias funes, das quais as mais importantes so: a
respiratria, a deglutitria e a fonatria.
3.4.1 Funo Respiratria

Esta funo ocupa a maior parte do tempo desse rgo. A abertura da laringe
permite a entrada e a sada do ar dos pulmes. Durante o ato inspiratrio a laringe
ligeiramente rebaixada, passando a ser tracionada ligeiramente para cima durante a
expirao; esse deslocamento proporcional intensidade da respirao. A traquia e o
diafragma participam da descida da laringe, contribuindo, junto com o msculo
cricoaritenideo posterior, para o afastamento das aritenideas e das pregas vocais. Os
msculos infra-hiideos contribuem para a descida da cartilagem tireidea e,
conseqentemente, para a abertura da laringe.
13
3.4.2 Funo Deglutitria

Primeiramente a deglutio ocorre na boca e voluntria, sendo seguida de uma
fase involuntria, onde ocorre o fechamento mximo da laringe. Esta a fase farngea.
Durante a deglutio, na fase farngea, a luz larngea se fecha de baixo para cima
protegendo as vias areas, sendo essa proteo uma funo vital.
3.4.3 Funo Fonatria

A fonao uma habilidade adquirida pela espcie humana (BEHLAU E
REHDER, 1997). Com a evoluo, o ser humano aprendeu a coordenar orgos que,
fisiolgica e anatomicamente apresentavam como funes primordiais a respirao,
alimentao e proteo das vias areas inferiores. Deste modo, a voz apesar de sua
beleza e aprimoramento, uma funo adaptada e, como tal, depende da integridade e
equilbrio das estruturas do trato vocal.
Ao emitir a voz, as pregas vocais se aproximam da linha mdia, controlando a
sada do ar que advm dos pulmes. O ar, por sua vez, ao passar pela laringe, coloca em
vibrao as pregas vocais, que esto prximas entre si. As pregas vocais, neste instante,
fecham-se e abrem-se numa seqncia rpida, realizando a funo fonatria.
3.5 ANATOMIA DAS PREGAS VOCAIS

Considerando-se o funcionamento vocal, o conceito mais importante sobre a
estrutura da prega vocal que esta um vibrador com vrias camadas epiteliais. De um
modo geral, pode-se dizer que a prega vocal composta de mucosa e msculo. A
mucosa divide-se em epitlio e lamina prpria. A funo do epitlio cobrir e manter a
forma da prega vocal. O epitlio formado por tecido escamoso estratificado.
14
A lmina prpria, por sua vez, pode ser dividida em trs camadas: superficial,
intermediria e profunda (HIRANO, 1977). A camada superficial, freqentemente
referida como espao de Reinke, frouxa e flexvel, sendo essa camada que vibra mais
intensamente durante a fonao. A camada intermediria consiste principalmente de
fibras elsticas e a profunda composta de fibras de colgeno podendo ser comparadas
s linhas de algodo. Por no haver um limite definido entre as camadas intermediria e
profunda, d-se o nome de ligamento vocal juno destas, sendo que o nmero de
fibras elsticas diminuem e as de colgeno aumentam em direo ao corpo da prega
vocal.
O corpo da prega vocal composto pelo msculo vocal e quando esse se contrai,
funciona como um feixe de elsticos muito rijo. No h uma delimitao entra as fibras
colgenas da camada profunda e as fibras mais superficiais do msculo vocal.
As estruturas descritas podem ser agrupadas em trs sees: a cobertura,
(consistindo do epitlio e da camada superficial da lmina prpria); a transio
(compostas pelas camadas intermediria e profunda da lmina prpria); e o corpo
(composto do msculo vocal).
Durante a fonao, o deslocamento da cobertura apresenta uma componente
vertical contraria a gravidade produzindo um movimento elipsoidal, enquanto que o
corpo oferece estabilidade e o tono muscular de base. A transio, por sua vez, serve de
acoplamento entre a camada superficial e o msculo vocal (BEHLAU, 2001).
3.6 VIBRAO DAS PREGAS VOCAIS

A vibrao das pregas vocais pode ser alterada ou gerar novos modos de
vibrao em decorrncia de mudanas assimtricas na massa, elasticidade e tenso nas
prprias pregas vocais (ppvv).
15
Outras alteraes, como paralisia dos msculos respiratrios, podem causar

presso subgltica insuficiente, alterando as foras aerodinmicas que agem sobre as
pregas vocais o que, tambm, alterar as vibraes.
A conceituao de vozes normais e disfnicas negocivel, visto que, implica
uma certa subjetividade. A dicotomia existente entre normalidade versus disfnia um
dos temas mais controvertidos na rea fonoaudiolgica. A palavra normal, que significa
segundo a norma quando aplicada ao comportamento humano, defronta-se a questes
influenciveis, como, por exemplo, gosto pessoal, modismo, fatores raciais, culturais e
sexuais. Desta maneira, pode-se formular apenas padres de vozes ditas normais.
Tabith (1995), coloca que normalidade vocal implicam a dependncia de vrios
fatores, como normalidade anatmica e funcional, boa coordenao entre respirao e
fonao, boa sade geral, ausncia de problemas psicolgicos relevantes e emisso
agradvel.
So sugeridas por Aronson (1990), trs questes para o julgamento de vozes
normais: 1) se a voz adequada para oferecer ao ouvinte inteligibilidade de fala; 2) se
suas propriedades acsticas so aceitveis; 3) se a voz preenche as demandas
profissionais e sociais do falante. O autor acresce seu discurso colocando que a
variedade vocal ilimitada e os padres de adequao vocal so amplos.
Para Behlau (2001), a voz deve ser produzida sem esforo e com conforto,
identificando o sexo e a faixa etria a que pertence. A autora prope a utilizao do
termo voz adaptada, ao invs de voz normal, pois, a produo vocal deve ser aceitvel
socialmente e apropriada s caractersticas scio- histrico-culturais do falante.
Encontra-se na literatura uma variedade de classificaes destinadas a conceituar
as disfonias, dentre as quais, explanar-se- algumas destas.
16
Aronson (1980), classifica as disfonias em trs grupos principais: disfonias

orgnicas, (como tumores, inflamaes, problemas endcrinos, traumas e desordens
neurolgicas), desordens psicognicas (como estresse emocional, ndulos, quadros de
psiconeurose, falsete mutacional, voz infantil no adulto, iatrognia e mutismo) e
disfonias de origem indeterminada (como a disfnia espasmdica).
As disfonias so classificadas por Brandi (1990), em dois grupos: disfonias
comportamentais (como desvios do padro vocal, conduta vocal hiperfuncional ou
hipofuncional) e disfonias estruturais (decorrentes de anomalias congnitas, ou por
laringopatias).
Garcia-Tabia e Cobeta (1996), dividem as disfonias em quatro grupos: disfonias
de causa orgnica, (podendo ser congnitas ou adquiridas como as traumticas,
inflamatrias, neoplsicas, endocrinolgicas, neurolgicas e ps-cirurgia larngea),
disfonias de causa funcional, (podendo ser habituais ou psicognicas), disfonias por
leses associadas (como ndulos, plipos, edema de Reinke e granuloma de contato) e
disfonias de causa psiquitricas (esquizofrenia, desordens afetivas, transtorno bipolar e
outras).
Consideradas por Pinho (1998), trs formas de classificar as disfonias, a saber:
disfonias funcionais, em que h presena de distrbio vocal com ausncia de alteraes
orgnicas significativas; disfonias orgnicas secundrias, que so disfonias decorrentes
do uso inadequado da voz e geram alteraes orgnicas conseqnciais; e disfonias
orgnicas primrias, disfonias que surgem independente do uso da voz.
Behlau e Pontes (1995), classificam as disfonias em trs categorias: disfonias
funcionais, que so disfonias provenientes de desvios do processo bsico de produo
vocal, apresentando como conseqncia mais comum, a fadiga vocal; disfonias
orgnico-funcionais, que so disfonias funcionais diagnosticadas tardiamente, gerando
17
uma leso secundria, como por exemplo, o ndulo vocal; e disfonias orgnicas, cuja
etiologia independe do uso da voz e advm de quadros inflamatrios ou infecciosos,
gripes e laringites, alteraes vocais por carcinoma da laringe e ou doenas neurolgicas
como doena de Parkinson e Esclerose Lateral Amiotrfica.
Por haver vertiginosa aceitao no meio fonoaudiolgico adotar-se-, neste
trabalho, a classificao ditada por (BEHLAU E PONTES, 1995).
De qualquer forma, os sintomas acsticos percebidos durante o processo
patolgico da laringe so mudanas na freqncia fundamental, na intensidade da voz
ou em sua qualidade. Esses sintomas so indicativos de alteraes orgnicas e/ou
funcionais e a natureza desses sintomas varia para cada paciente e tambm com o
estgio da patologia.
3.6.1 Freqncia Fundamental

A freqncia fundamental de um som voclico funo da massa, da
elasticidade e do comprimento das pregas vocais. Tambm depende da presso
subgltica e da configurao do trato vocal (carga acstica).
Segundo Nieto et al. (1995), a freqncia fundamental diretamente
proporcional tenso das pregas vocais ou a presso subgltica e inversamente
proporcional massa e a largura das pregas vocais .
A freqncia fundamental definida como o nmero de vibraes por segundo
produzidas pelas pregas vocais. Em mulheres adultas, a freqncia mdia situa-se ao
redor de 200 Hz e em homens adultos, cerca de 100 Hz (BELHAU E PONTES, 1995).
O pitch considerado a forma perceptiva da freqncia fundamental (BEHLAU, 1997).
A constatao de que um paciente tem uma regulao de freqncia adequada
envolve um julgamento, por um especialista treinado, em comparao com vozes de
18
pessoas que apresentam tamanho, sexo e idade similar. Nos distrbios funcionais que
envolvem alta freqncia, as pregas vocais so muito exigidas no ponto de mximo
deslocamento. Este abuso vocal pode produzir laringite, causando o desenvolvimento de
ndulos, ou agravando uma patologia existente.
3.6.2 Intensidade Vocal

A intensidade depende diretamente da resistncia que a glote oferece passagem
de ar, ou seja, uma glote eficiente gera aumento da presso subgltica, responsvel pela
variao da intensidade (BEHLAU, 2001).
Fatores como velocidade da emisso do ar e quantidade de ar emitido tambm
interferem na intensidade vocal, e so diretamente relacionados presso subgltica, ou
seja, quanto maior for a presso subgltica, maior ser a velocidade e a quantidade do ar
emitida.
A etiologia de vozes com intensidade fraca pode ser atribuda coaptao
gltica deficiente, gerando assim uma presso subgltica insuficiente (por exemplo, em
casos de paralisia dos msculos respiratrios, ou por paralisia de pregas vocais cuja boa
coaptao est afetada).
A forma perceptiva da intensidade denominada loudness.
3.6.3 Qualidade Vocal

O termo qualidade vocal, antigamente conhecido como timbre o que
caracteriza e identifica a impresso vocal. Uma degradao na qualidade vocal,
geralmente definida como rouquido, freqentemente o primeiro, e algumas vezes o
nico sintoma de disfuno laringeal.
19
Vrios so os termos utilizados para conceituar a voz, levando assim a

divergncias no que concerne a nomenclatura. A impreciso da terminologia to
acentuada que se apropria de vocbulos inerentes a outros sentidos, como por exemplo,
ao se dizer que a voz clara, utiliza-se assim do sentido da viso, ou quando se infere
que a voz rude, sendo esse um atributo do sentido ttil. No entanto, tais terminologias
so corriqueiramente usadas.
Sonnimem e Hurne (1992 apud BELHAU e PONTES*, 1995), nomeiam as
vozes em mais de cinqenta termos.
Foi adotado por Behlau e Pontes (1995), vinte e um tipos de vozes. So eles: voz
rouca, soprosa, spera, sussurrada, fluida, gutural, comprimida, tensa-estrangulada,
bitonal, diplofnica, polifnica, montona, trmula, pastosa, crepitante, infantilizada,
virilizada, presbifnica, hipernasal, hiponasal e com nasalidade mista.
Revisando-se a literatura, nota-se o estudo minucioso de diversos autores quanto
notificao dos diferentes tipos de vozes.
Neste trabalho, trs tipos de alteraes na qualidade vocal so sugeridos
fundamentais, pois acredita-se que as vozes rouca, soprosa e spera podem suprir e
englobar toda e qualquer alterao vocal. O intuito de tal proposta est fundamentado
em facilitar uma classificao para os profissionais atuantes, para que estes se
expressem dentro de um linguajar mais comum, no mais subdividindo-se, mas
interagindo entre si, dentro de uma abordagem mais simplista.
Prope-se estabelecer assim, uma neo-conceituao apropriando-se de termos
j existentes e consagrados, destacando a concordncia deste intento com os correlatos
fisiolgicos estabelecidos por Pinho (1998), nos trs tipos de vozes citados, a saber: voz
rouca, correspondente presena de irregularidade vibratria da mucosa das pregas
*
BEHLAU, M.& PONTES, P. Avaliao e Tratamento das Disfonias. So Paulo: Lovise, 1995.
20
vocais durante a produo vocal; voz spera, que ocorre quando h reduo ou ausncia
da onda de mucosa que reveste as pregas vocais; voz soprosa, correspondente
presena de rudo de fundo, audvel.
Esta viso de uma abordagem simplista somente tem o intuito de propiciar aos
profissionais da rea e reas afins uma unificao de termos, no desmerecendo os
pesquisadores, nem se atendo idia reducionista.
3.7 PARMETROS ACSTICOS

A anlise dos parmetros acsticos evidencia, segundo vrios autores, diferenas
entre as vozes consideradas normais e patolgicas. Diversos pesquisadores propuseramse a quantificar os parmetros acsticos vocais, embasados na freqncia e na amplitude
do sinal vocal.
Para tanto, estudaram o sinal vocal, como citado por Nieto (1995), nos domnios
do tempo e da freqncia.
No domnio do tempo, v-se o sinal de voz bidimensionalmente (Figura 3): em
um eixo cartesiano tem-se o tempo como varivel independente e, no outro, a amplitude
em funo do tempo.
Figura 3: Sinal vocal no domnio do tempo.
21
No domnio da freqncia, o sinal vocal analisado em suas componentes de

freqncia, bidimensionalmente, em relao amplitude, ou seja, o espectro vocal
(Figura 4).
Figura 4: Sinal vocal no domnio da freqncia.
3.7.1 Parmetros Acsticos no Domnio do Tempo

Lieberman (1963), verificou atravs da distribuio das diferenas entre perodos
sucessivos, que os casos patolgicos apresentavam-se na regio desta curva, acima de
0,5 ms. Com isso definiu a medida PFF (fator de perturbao de pitch ou fator de
perturbao de freqncia), que o nmero de vezes que o mdulo da diferena entre o
perodo a ser avaliado e o perodo mdio excede 0,5 ms, normalizado pelo perodo
mdio. Perturbaes de freqncia, derivadas a partir das formas das ondas acsticas,
podem refletir variaes na periodicidade glotal, variaes no envoltrio da onda ou
mudanas na configurao do trato vocal. Perturbaes com magnitudes maiores ou
iguais a 0,5 ms podem ser induzidas por um decaimento da presso do ar atravs da
glote e indica variaes no padro vibratrio das pregas vocais. As perturbaes de
freqncia que foram medidas para vozes normais so menores do que
aproximadamente 0,2 ms. Sujeitos com algum tipo de patologia na laringe podem ter
22
maiores perturbaes de freqncia que sujeitos com vozes normais, com o mesmo
perodo mdio fundamental. O fator de perturbao sensvel ao tamanho e
localizao da alterao tecidual patolgica na laringe do sujeito. Para Lieberman,
leses na lmina prpria causam perturbaes menores que leses no msculo.
Koike (1973), desenvolveu a medida RAP (perturbao mdia relativa da
freqncia), que considera as estruturas supraglotais, pois conforme o autor, o contato
do microfone com a garganta o melhor indicador da aperiodicidade larngea. Em
ltima anlise uma dessensibilizao do perodo, atravs de uma filtragem passabaixas, usando o valor mdio e o janelamento de trs perodos da freqncia.
Em Takahashi e Koike (1975), as vozes ditas patolgicas so percebidas como
rouca, spera e soprosa, porm no so pertinentes para um diagnstico mais preciso.
Para elucidar um diagnstico por meio da voz, alguns estudos perceptivos so
necessrios. E um dos procedimentos propostos por Osgood* (1957), citado pelos
autores, a tcnica diferencial semntica. Esta tcnica tem sido utilizada por muitos
pesquisadores para estudar a impresso auditiva da voz e da fala humana. So
considerados quatro fatores perceptivos: fluidez, rouquido, magnitude e extenso
vocal, sendo que culturas de lnguas diferentes no interferem no resultado, ou seja, a
percepo a mesma. Aps terem feito uma anlise perceptiva, fizeram uma
comparao por meio de tcnicas acsticas envolvendo freqncia fundamental (F0),
quociente de perturbao de freqncia (FPQ) e quociente de perturbao de amplitude
(APQ) dos trechos mais estveis da vogal /a/, sustentada durante, aproximadamente, 1,5
segundos e captadas pelo microfone de contato. O parmetro FPQ foi definido como a
perturbao mdia normalizada do perodo da freqncia pico-a-pico e o APQ como a
TAKAHASHI, H. E KOIKE, Y. Some Perceptual Dimensions and Acoustical Correlates of Pathologic

Voices. Acta Oto-laryngologica, Suppl.338, 1-24, 1975.
23
perturbao mdia normalizada do perodo de amplitude pico-a-pico. Definiram estes

parmetros com base em um janelamento de 11 perodos.
Davis (1979), usando caractersticas e sinais obtidos por meio do filtro inverso
residual, desenvolveu um perfil vocal para demonstrar informaes acsticas sobre a
voz e servir como um histrico mdico do paciente. Por meio das informaes
acsticas, Davis demonstrou que as medies poderiam discriminar falantes normais de
patolgicos. So seis parmetros acsticos determinados para definir este perfil, a saber:
PPQ (quociente de perturbao do perodo de freqncia), APQ (quociente de
perturbao da amplitude), EX (coeficiente de excesso), PA (amplitude da
autocorrelao do sinal residual), SFF (suavidade espectral do filtro inverso) e SFR
(suavidade espectral do sinal residual). Os parmetros SFF e SFR so estudados no
domnio espectral. O PPQ e o APQ so semelhantes ao RAP de Koike e ao APQ de
Koike e Takahashi. Visando esclarecer as diferenas entre esses parmetros acsticos,
Davis estudou a influncia do tamanho da janela na preciso do resultado. Investigou os
benefcios das alteraes no tamanho das janelas, encontrando que a janela com cinco
perodos produz resultados melhores nas medidas de perturbao APQ e PPQ na
discriminao de vozes patolgicas ou normais. O parmetro EX, definido por Cramer*
(1958, apud DAVIS 1979), permite quantificar a relao sinal-rudo do sinal residual.
O PA pode ser considerado como um ndice de vocalizao e definido como a mxima
amplitude na funo autocorrelao do sinal. Dessa forma, o PA alto para sons
voclicos, pequeno para sons fricativos sonoros e zero para sons fricativos surdos.
DAVIS, S.B. Acoustic Characteristics of Normal and Pathological Voices. In Lass, N.J. (ED) Speech
and language: Advances in Basic Research and Pratice, vol.1, New York Academic Press, 271-335, 1979
24
3.7.2 Parmetros Acsticos no Domnio da Freqncia

Frkjr-Jensen e Prytz (1976), registraram 22 vozes saudveis e 50 patolgicas
(pacientes que apresentavam reduo na energia espectral ou seu aumento na regio do
1. formante durante a recuperao) de indivduos de ambos os sexos em um sistema
desenvolvido no prprio laboratrio dos autores. Analisaram-nas por meio do espectro
mdio de longo termo (Long-time-average-spectra - LTAS) e experimentaram comparar
suas qualidades vocais propondo um novo parmetro, chamado , que uma medida
das relaes de intensidade das freqncias mais altas e mais baixas do espectro da fala.
Ou seja, o resultado da soma das intensidades acima de 1 kHz dividida pela soma
das intensidades abaixo de 1 kHz. O parmetro independente da distncia do
microfone, do nvel de amplificao,
porque o espectro acima de 1 kHz est
normalizado em relao ao espectro abaixo de 1 kHz. Esses pesquisadores tentaram

encontrar novos mtodos para LTAS no balano entre as partes altas e baixas do
espectro da fala, afirmando que esse balano depende da fonte vocal e parece estar
correlacionado com o termo qualidade vocal, o qual definem como propriedade
auditiva, isto , um aspecto da percepo da voz humana ainda mal elaborado.
Demonstraram que o parmetro , bem como o desenvolvimento de instrumentao e
mtodos, podem ser usados com finalidade diagnstica e, ainda, como avaliao da
terapia vocal, no s pela representao do que ocorreu durante o processo teraputico
mas tambm pela comparao da qualidade vocal antes e aps a terapia de voz.
Kojima et al. (1980), separaram os componentes harmnicos da voz usando um
computador com a finalidade de obterem um clculo objetivo para avaliar
quantitativamente a rouquido. Determinaram o parmetro Ra, que a razo da energia
dos harmnicos mltiplos de trs pela energia das componentes harmnicas entre estes,
consideradas pelos autores como rudo, em uma janela com trs perodos de freqncia,
25
pela Transformada de Fourier. Compararam os resultados desse parmetro com a

impresso auditiva de cinco pessoas sem conhecimento prvio sobre voz. A obteno
das amostras (58, no total) foi feita por meio da produo da vogal sustentada /a/. Os
resultados calculados mostraram uma forte correlao com a impresso auditiva e este
estudo sugeriu que este mtodo de separao dos componentes harmnicos da voz rouca
pode ser til no clculo quantitativo da rouquido, permitindo sua graduao em vrios
nveis.
Yumoto et al. (1982), desenvolveram a razo harmnico-rudo (HNR), que
computacionalmente menos complexa e consome menos tempo para avaliar
quantitativamente o grau de rouquido. Basearam-se na suposio que a onda acstica
de uma vogal sustentada consiste de um componente peridico e de um componente
ruidoso (mdia zero na distribuio da amplitude). Em uma cabina acstica registrou-se
a vogal /a/ sustentada, emitida em uma um nvel de sonoridade confortvel para um
grupo de pessoas com vozes normais na faixa etria de 19 a 60 anos de idade (22
homens e 20 mulheres) e um grupo de sujeitos de 21 a 68 anos de idade com vrias
patologias larngeas pr e ps operatrio (12 homens e 8 mulheres). Na tela do monitor
do computador foram exibidas duas formas de onda: uma original na qual foi
determinado o perodo mais estvel para anlise (600 ms) e uma onda filtrada (passabaixa de 500 Hz) para determinao da freqncia pelo mtodo semi-automtico de
cruzamento por zero. Por meio de um filtro banda-estreita obteve-se espectrogramas da
fonao original e a extrao do componente ruidoso. Foram usados 50 perodos para
calcular a HNR. Os resultados mostraram correlao entre componentes ruidosos da
fonao, mesmo quando o indivduo apresentou rouquido severa. Consideraram a HNR
menor que 7,4 dB como patolgica, baseados na distribuio da HNR para vozes
normais (5% - taxa de falso alarme). Os autores compararam a razo harmnico-rudo
26
(HNR) com a razo sinal/rudo (S/N) proposta por Kojima et al. (1980) e verificaram
que os valores encontrados em dB para (S/N) foram maiores que os encontrados para
(HNR) e justificaram esta discrepncia devido a diferena metodolgica entre os dois
estudos. O coeficiente de correlao de Spearman foi 0,849 e significante com p=0,001,
o que confirmou que a HNR foi um ndice til para avaliar quantitativamente o
componente ruidoso relativo ao componente harmnico da vogal, mas afirmaram a
necessidade de estudos futuros para confirmar a relao entre a HNR e as medidas
psicofsicas do grau de rouquido.
No estudo de Hiraoka et al. (1984), o tempo de intervalo para anlise foi fixado
independentemente, sendo a freqncia fundamental e a freqncia harmnica
determinadas automaticamente pela Transformada de Fourier. A avaliao objetiva foi
realizada considerando as caractersticas de vozes roucas, que mostraram a intensidade
da freqncia fundamental mais proeminente, comparada com os harmnicos do
espectro vocal, conforme afirmao dos autores. A intensidade harmnica relativa (Hr),
obtida por meio de uma poro estvel da vogal /a/ sustentada, denota a porcentagem
das intensidades das componentes harmnicas relativas a intensidade vocal total. Os
autores estabeleceram um limite de 67,2% para Hr como discriminador entre vozes
normais e patolgicas. Das vozes normais examinadas, 95% tiveram a intensidade
harmnica maior que o valor crtico de 67,2%, enquanto que 90% das vozes roucas
tiveram a intensidade harmnica menor que o valor crtico.
Kasuya et al. (1986), desenvolveram uma medida de energia do rudo
normalizado (NNE) que estimou os componentes ruidosos da fonao de uma vogal
sustentada e propuseram uma medida acstica para a deteco de patologias larngeas.
O sinal vocal foi filtrado atravs de um filtro pente adaptativo operando no domnio da
freqncia. Basearam-se em um sinal de voz com janelamento de 7 perodos de uma
27
vogal que continha um componente peridico e um componente ruidoso aditivo. Em um

ambiente silene, um grupo de 64 sujeitos com vozes normais e outro grupo com 186
sujeitos com patologias larngeas emitiram, por 5 vezes, a vogal japonesa /e/ sustentada
em uma freqncia confortvel e em um nvel de intensidade vocal aumentado.
Determinou-se o perodo fundamental mdio (Tp) pela autocorrelao em janelas de 40
ms (KASUYA et al., 1984). O comprimento da janela de dados a ser analisado foi
determinado em 7 Tp e usado para anlise espectral sobre todo intervalo. Segundo os
autores, o nvel de rudo pode ser melhor avaliado na faixa de altas-freqncias para a
discriminao de vozes normais e patolgicas. Os experimentos mostraram que o
cncer gltico avanado T2-T4 pode ser perfeitamente detectado como patolgico com
um erro de 9,4% para sujeitos normais. Para o caso de paralisia do nervo recorrente e
ndulos das pregas vocais, os erros so 9,1% e 20%, respectivamente. Em comparao
com essas doenas, as razes dos erros foram um pouco altas para plipos nas pregas
vocais e laringites. Cncer avanado supra e subgltico e cncer faringeal tambm
foram discriminados de amostras normais porque eles exibiram invaso direta sobre as
pregas vocais. A medida NNE comparada com os parmetros HNR (YUMOTO et al.
1982) e o Hr (HIRAOKA et al., 1984) mostrou-se mais eficiente para discriminao de
vozes patolgicas e normais, alm de tambm ser til para discriminar cncer gltico
T2-T4, paralisia do nervo recorrente, ndulo nas pregas vocais de casos normais, apesar
de ter encontrado um falso positivo para seis sujeitos com vozes normais, os quais
considerou com cncer.
Fukazawa et al. (1988), desenvolveram o ndice Br que indica o rudo turbulento
em vozes soprosas e testaram sua validade. Basearam-se na razo entre a energia do
sinal filtrado por um passa-alta de segunda ordem pela energia do sinal original. Um
grupo de 24 sujeitos com vozes normais e um grupo de 31 indivduos com rouquido
28
(10 casos de plipos na prega vocal, 15 de paralisias do nervo recorrente e 6 de cncer

gltico), emitiram a vogal /a/ sustentada diante de um microfone a uma distncia de 15
cm da boca. Por meio de um microcomputador a voz foi processada e utilizando uma
amostra de comprimento 25,6 ms calculou-se o ndice Br. A impresso auditiva para
avaliar a soprosidade e a rouquido foi feita por dois experientes mdicos de acordo
com o mtodo de Isshiki (1964). A correlao entre o ndice Br e a percepo de
soprosidade foi significante ao mesmo nvel que a correlao perceptiva entre os
avaliadores. Por outro lado, a correlao entre o ndice e a percepo de rouquido no
foi significante. No grupo de sujeitos com vozes normais realmente no houve presena
de soprosidade nem de rouquido, com uma mdia de 27,0 variando de 8,3 a 75,7. Nos
casos de vozes com patologias, por meio da caracterizao psicoacstica, a correlao
entre soprosidade e o ndice Br foi 0,734 e a correlao entre rouquido e o ndice Br foi
somente 0,211. As vozes patolgicas tiveram um ndice Br maior do que as normais.
Estatisticamente, a mdia do ndice Br dos 31 sujeitos roucos foi maior que dos 24
sujeitos com vozes normais (p= 0,01). J a mdia dos casos com cncer larngeo foi
maior que dos casos com paralisia do nervo recorrente e dos casos com plipos (p=0,05
e p=0,02, respectivamente).
Shoji et al. (1992), investigaram um novo mtodo para discriminar vozes
normais de soprosas atravs da relao de potncia em altas-freqncias pela potncia
total do sinal vocal (HFPR), cujo limiar de alta-freqncia (Fc) foi estimado em torno
de 5 kHz, devido maior concentrao de energia da voz normal estar situada abaixo
desta freqncia. Para isso, gravaram a vogal sustentada /a/ de 24 sujeitos com voz
soprosa (3 deles em pr e ps cirrgico) e 16 indivduos formaram o grupo controle (9
homens e 7 mulheres). Encontraram que a razo de duas varincias em ANOVA
demonstrou que os dois grupos, sujeitos com vozes alteradas e controles, comeam a
29
apresentar faixas de valores diferentes para o ndice HPFR a partir de Fc igual a 4 kHz e
a 6 kHz, regies em que no ocorreram sobreposies. Concluram que para Fc (6 kHz)
o limite de separabilidade entre vozes normais e soprosas 30 dB. Alm disso, o
ndice HFPR , tambm, uma ferramenta til para a avaliao de fonocirurgia.
Hillenbrand et al. (1994), mediram a relao entre as avaliaes de soprosidade e
uma gama de medidas acsticas. Estas medidas enquadraram-se em 3 categorias: a)
medidas da periodicidade do sinal; b) medidas da amplitude do primeiro hamnico e c)
medidas de inclinao espectral. A amostra foi constituda por 8 homens e 7 mulheres
na faixa etria de 22 a 37 anos de idade sem relato de problemas vocais, de fala ou de
audio. Cada falante foi treinado a produzir 3 variaes vocais (normal,
moderadamente soprosa e muito soprosa), das quais se estimou a mdia da freqncia
fundamental. Esta freqncia foi calculada a partir da leitura de um trecho do texto
Rainbow Passage (FAIRBANKS, 1940), processado pelo equipamento Visi-Pitch da
Kay Elemetrics/interface IBM PC (HORII, 1983). Incluiu-se, ainda, as vogais [a], [I],
[] e [o] , sustentadas por, aproximadamente, 3 segundos, perfazendo um total de 12
amostras voclicas (4 vogais x 3 variaes vocais). Vinte ouvintes, estudantes de
graduao de Patologias da Fala-Linguagem (Universidade de Michigan), foram
recrutados para avaliar as amostras voclicas, aps terem realizado audiometrias
(freqncias 0,5; 1; 2; 4 e 6 kHz). Na anlise acstica utilizou-se a proeminncia de
pulso cepstral (CPP), que a distncia do pico reta de regresso linear normalizado
para todas as amplitudes; o Pearson r no pico de autocorrelao ( RPK); a relao entre
a amplitude de pico pela amplitude mdia do valor absoluto do sinal (P/A); o indice de
soprosidade (BRI), que consiste na media do Br em janelas de 25,6 ms com passo de 10
ms do sinal; a razo da mdia da energia espectral na faixa menor que 4 kHz e
maior/igual que 4 kHz (H/L), que uma modificao do HFPR, com o limiar de
30
freqncia em 4 kHz, apresentando a relao de energias superior e inferior a este

limite; e a relao entre o 1. harmnico e o 2. harmnico (H1A), com unidades em dB.
Os resultados encontrados pelos autores demonstraram que os parmetros CPP e
RPK so os mais consistentes para quantificar soprosidade. Os ndices BRI, H/L e H1A
apresentaram fraca correlao com as medidas de soprosidade, para confirmao dos
achados os autores fizeram modificaes nas operaes matemticas no encontrando
resultados confiveis para esses ndices.
31
4 METODOLOGIA
Cento e trinta indivduos, de ambos os sexos, na faixa etria de 21 a 45 anos de

idade colaboraram para este estudo com suas vozes. Do total de voluntrios, 77
indivduos eram do sexo feminino, sendo os 53 restantes do sexo masculino.
A seleo destes indivduos ocorreu aleatoriamente, exceo da faixa etria,
que teve a idade mnima estabelecida pelo estatuto do Comit de tica do Hospital das
Clnicas da Faculdade de Medicina de Ribeiro Preto da Universidade de So Paulo
(HC/FMRP/USP) e a idade mxima para se evitar vozes em fase de senilidade.
Aps assinatura do termo livre e esclarecido (ANEXO A) para participao
neste estudo, devidamente aprovado pelo comit referido acima (ofcio n 2259/2002 ),
os indivduos foram conduzidos a uma entrevista com a pesquisadora para
preenchimento de uma ficha de identificao contendo dados pessoais como: nome,
sexo, idade, data de nascimento e endereo.
A partir da, o indivduo foi orientado sobre o processo de registro da voz,
realizando um treinamento prvio, evitando assim, possveis influncias psicolgicas e,
conseqentemente, alteraes vocais no existentes. Neste treinamento, foi solicitado
que cada voluntrio emitisse a vogal sustentada /a/ amostra vocal a ser coletada para
este estudo em nveis de altura e intensidade confortveis, a fim de que no ocorresse
tenso excessiva sobre pregas vocais .
32
Depois do treinamento, a gravao das amostras vocais dos voluntrios foi

realizada diretamente em computador, em sala tratada acusticamente Laboratrio de
Voz do HC/FMRP/USP onde o voluntrio foi posicionado sentado, com o microfone
a 10 cm frente de sua boca e solicitado a emitir a vogal sustentada /a/ por 5 segundos.
O controle da durao da emisso estava previamente padronizado pelo programa de
captao/anlise do sinal de voz: Anlise de Voz, verso 2.0, da DSP Instrumentos
Ltda.
O computador foi um Pentium de 100 MHz, 16 Mb de memria e 1 Gb de
winchester. A converso analgico-digital foi realizada atravs da placa de aquisio de
dados convencional, marca Soundblaster SB16, sendo a taxa de amostragem utilizada
de 22050 Hz com resoluo de 16 bits.
O microfone utilizado foi do tipo cardiide, marca LeSon, modelo SM58,
unidirecional e com ganho dinmico, segundo estudos de Rosa (1998).
A mesma amostra voclica serviu simultaneamente para anlise acstica
computadorizada e para avaliao perceptivo-auditiva da qualidade vocal, realizada pela
pesquisadora.
A avaliao perceptivo-auditiva da qualidade vocal consistiu na seguinte
classificao: voz neutra para vozes sem alteraes na qualidade vocal enquanto que
para vozes com qualidade vocal alterada seguir-se Behlau e Pontes (1995).
As amostras vocais armazenadas no computador foram transferidas para um cd e
levadas para o Laboratrio de Instrumentao e Microeletrnica do Departamento de
Engenharia Eltrica da Escola de Engenharia de So Carlos da Universidade de So
Paulo
(LIM/SEL/EESC/USP).
Neste
local,
realizou-se
anlise
acstica
computadorizada, por meio do programa Anlise de Voz j referido anteriormente.
33
Na anlise, cada amostra vocal do /a/ sustentado teve seus trechos inicial e final
desprezados, conforme estudos de Krom (1995), considerando-se apenas o tero mdio
da emisso. Este teve a durao de 30 janelas de 512 pontos, o qual corresponde a 696,6
ms. Essa durao de tempo decorrente da freqncia de amostragem usada (22.050).
De acordo com este programa de anlise vocal, determinou-se os seguintes
parmetros sobre o sinal vocal: jitter (em %), shimmer (em %), suavidade espectral do
filtro (SFF, em dB), suavidade espectral do sinal resdual (SFR, em dB), ndice de
vocalizao (PA em valor absoluto) e coeficiente de excesso (EX, em valor absoluto).
Todos os voluntrios passaram, ainda, por uma inspeo de videoestroboscopia
no HC/FMRP/USP realizada por profissional habilitado. Durante esta inspeo,
solicitou-se que cada um dos voluntrios emitisse a vogal sustentada /i/ durante o tempo
que o profissional julgasse necessrio para esta avaliao. Ainda este profissional, no
final desta avaliao, fornecia o diagnstico das ppvv avaliadas para o voluntrio ao
mesmo tempo que confrontava seus achados clnicos com a avaliao perceptivoauditiva, realizada anteriormente.
A pesquisadora anotou, ento, junto sua avaliao perceptivo-auditiva, o
resultado clnico da inspeo videoestroboscpica para comparaes posteriores.
34
5 RESULTADOS E DISCUSSO
Na avaliao perceptivo-auditiva nenhuma das amostras vocais apresentou

qualidade vocal alterada, sendo todas, ento, classificadas como neutras.
Pela clnica, atravs da videoestroboscopia, houve em todas as amostras vocais a
confirmao diagnstica de ausncia de alteraes vocais. Ou seja, todas as pregas
vocais apresentaram adequada mobilidade, com ciclo gltico satisfatrio. Pde-se,
ainda, observar que nos aspectos fsicos, as pregas vocais tinham colorao tambm
adequada, sem alteraes de massa.
Na avaliao objetiva dos parmetros contidos no programa utilizado obteve-se
os seguintes resultados:
Freqncia fundamental (F0)
O histograma da figura 5 mostra a freqncia relativa de ocorrncias para a F0
dos voluntrios masculinos. A curva parece com a normal (gaussiana) o que corrobora
com o tamanho da amostra mostrando-a suficiente para este estudo. A anlise estatstica
dos parmetros acsticos obtidos esto na tabela 1 apresentada posteriormente.
Aproximadamente 70% do total das amostras do sexo masculino concentrou-se
entre 110 e 146,7 Hz, sendo o menor valor encontrado neste estudo foi em 95,6 Hz e o
maior valor em 175,9 Hz.
35
Nota-se neste estudo que houve uma diferena aproximadamente
de 28%
referente ao valor mdio citado por Bhelau e Pontes (1995), o valor mdio resultante
encontrado foi de 128,65 Hz com desvio padro de 20,75 Hz.
Algo que chama a ateno a distribuio mais dispersa do pitch masculino em
relao ao feminino (figura 6). No se encontra na literatura estudos a respeito de tal
ocorrncia. Considerando-se esta amostra representativa da populao, este fato pode
requerer maiores investigaes.
16
14
12
porcentagem
10
0
88,338
95,642
102,947
110,251
117,556
124,860
132,165
139,470
146,774
154,079
161,383
168,688
175,992
intervalos
Figura 5: Histograma da freqncia fundamental do sexo masculino
O valor mdio encontrado para a freqncia fundamental dos voluntrios

femininos de 209,61 Hz ( figura 6). V-se a forte concentrao em torno da mdia em
contraste para o grupo masculino.
Aproximadamente 46% do total das amostras concentrou-se em 203,5 Hz, tal
dado aproxima-se dos achados de Behlau e Pontes (1995), que discorrem
freqncia fundamental do sexo feminino situa-se ao redor de 200 Hz.
que a
36
50
45
40
35
porcentagem
30
25
20
15
10
0
162,076
172,444
182,811
193,178
203,545
213,913
224,280
234,647
245,015
255,382
265,749
276,116
286,484
intervalos
Figura 6: Histograma da freqncia fundamental do sexo feminino
Perturbao de perodo de pitch (Jitter)

Outro parmetro avaliado foi a perturbao de perodo de pitch. A figura 7
mostra a distribuio deste parmetro. Percebe-se atravs deste histograma a forte
concentrao para valores pequenos, aproximadamente 63% dos voluntrios encontramse abaixo de 3%. O valor mdio obtido para o jitter, considerando-se toda amostra
vocal, 1,99% com desvio padro 2,16%.
Apenas para exerccio de comparao e reportando-se aos achados de Lieberman
para PFF, que considera voz normal para variaes de perodo at 0,5 ms, neste estudo,
para vozes masculinas, a freqncia mdia de 128,65 Hz fornecendo um perodo de
7,77 ms. Portanto, 0,5 ms proposto por Lieberman representa 6,43% de variao do
perodo (jitter). Para as vozes femininas os valores so 209,61 Hz e 4,77 ms para pitch e
perodo, respectivamente. O jitter terico resultante 10,48%.
Pelos achados neste estudo verifica-se que o limite do parmetro proposto por
Lieberman conservador.
37
Para o Jitter, Davis encontrou em seus estudos os valores de 0,99% para a mdia
e desvio padro 2,28%. Independentemente das amostras vocais selecionadas, os
resultados esto bastante prximos daquele estudo.
40
35
30
porcentagem
25
20
15
10
0
0,000
0,488
1,345
2,201
3,057
3,914
4,770
5,626
6,483
7,339
8,195
9,052
9,908
intervalo
Figura 7: Histograma do jitter
Perturbao de amplitude (Shimmer)

O histograma relativo a este parmetro est mostrado na figura 8. Nota-se a
concentrao em torno do valor mdio 9,17%, sendo seu desvio padro 3,17%. Estes
valores esto em consonncia com Davis, que encontrou os valores 7,22% e 4,47%
respectivamente.
38
60
50
porcentagem
40
30
20
10
0
2,487
4,893
7,300
9,706
12,112
14,519
16,925
19,331
21,738
24,144
26,550
28,957
31,363
intervalo
Figura 8: Histograma do shimmer
Suavidade espectral do resduo (SFR)

Em relao ao parmetro de suavidade espectral do resduo, que em ltima
anlise avalia o espectro do sinal residual, os valores obtidos assemelham-se
favoravelmente com os dados de Davis. Os valores encontrados neste trabalho so
- 10,91 dB e 2,13 de desvio padro , enquanto os dados de Davis so: - 10,50 dB e 2,50.
A distribuio dos valores pode ser visualizada na figura 9.
39
30
25
porcentagem
20
15
10
0
-17,588
-16,512
-15,435
-14,359
-13,283
-12,206
-11,130
-10,054
-8,977
-7,901
-6,825
-5,748
-4,672
intervalos
Figura 9: Histograma do SFR
Suavidade espectral do filtro (SFF)

A suavidade espectral do filtro est intrinsecamente relacionada ao trato vocal.
Sua avaliao estabelece numericamente as caractersticas formantes. Neste estudo os
valores encontrados foram -12,73 dB para o valor mdio com desvio padro de 3,41.
Para termos de comparao os valores obtidos por Davis so -11,85 dB e 1,84
respectivamente.
40
35
30
porcentagem
25
20
15
10
0
-23,947
-22,333
-20,720
-19,106
-17,492
-15,879
-14,265
-12,651
-11,038
-9,424
-7,810
-6,197
-4,583
intervalos
Figura 10: Histograma do SFF
ndice de Vocalizao (P. A)

Este parmetro avalia a qualidade vocal realando a nitidez da vocalizao.
Para um som fricativo surdo, por exemplo, o valor do P. A zero. J para uma vogal
perfeita, o valor do P. A a unidade. Os valores intermedirios, portanto, estabelecem
uma escala de qualidade vocal. A distribuio deste parmetro pode ser visto na figura
11. Nota-se deste histograma que 96% dos voluntrios apresentam P.A maior que 0,4.
O valor unitrio atribudo a voz perfeita.
H que se ressaltar, ainda, os erros de processamento tais como, quantizao do
dado(decorre do processamento de digitalizao do sinal analgico, podendo ser
considerado uma fonte de rudo), induo eletromagntica (captao de campos
eletromagnticos pela instrumentao utilizada), rudo ambiente (todas as fontes
sonoras, exceto o sinal a ser captado, presentes no ambiente), no robustez do algoritmo
detetor do pitch.
41
35
30
porcentagem
25
20
15
10
0
0,183
0,237
0,292
0,346
0,401
0,455
0,510
0,565
0,619
0,674
0,728
0,783
0,837
intervalos
Figura 11: Histograma do P.A
Para efeito de ilustrao as figuras 12 e 13 apresentam o clculo da correlao do

resduo para vozes normal e patolgica respectivamente.
Note a maior regularidade dos picos para a voz normal, embora haja ainda
grande componente ruidosa resultante de erros de processamento, como os j citados.
Para a voz patolgica a estrutura regular mascarada pela maior quantidade de rudo
fornecendo, deste modo, um menor valor de P.A.
42
Figura 12: Resduo de voz normal para o PA
Figura 13: Resduo de voz patolgica para o PA
43
Coeficiente de Excesso (EX)
Este parmetro um correlato da relao sinal-ruido. Portanto, quanto maior seu

valor melhor ser a qualidade vocal. Os valores obtidos por Davis so 5,17 para a mdia
e 4,29 de desvio padro. Do grfico apresentado na figura 14 vemos que todos os
voluntrios apresentam valores de EX maiores que 5, podendo ser este o limite entre
normalidade e patolgico.
70
60
porcentagem
50
40
30
20
10
0
-0,935
5,055
11,045
17,035
23,025
29,015
35,005
40,995
46,985
52,975
58,965
64,955
70,945
intervalos
Figura 14: Histograma do EX
Sumarizando, elaborou-se uma anlise estatstica dos parmetros acsticos

avaliando a simetria e a curtose, cujos valores so apresentados na tabela 1. Apresentase tambm um quadro comparativo entre os valores obtidos por Davis e os encontrados
neste estudo (tabela 2).
44
SIMETRIA
CURTOSE
Jitter
11,5541
72,5008
Shimmer
113,1123
2276,9625
SFR
1,7130
55,9840
SFF
-14,1819
380,5350
PA
-0,0012
0,0006
EX
350,5444
7499,6247
Tabela 1: tabela com anlise estatstica
DAVIS
ANDRADE
Jitter
0,99 2,28
1,99 2,16
Shimmer
7,22 4,47
9,17 3,17
SFR
-10,50 2,50
-10,91 2,13
SFF
-11,85 1,84
-12,73 3,41
PA
0,725 0,105
0,579 0,116
EX
5,17 4,29
9,50 5,60
Tabela 2: tabela comparativa de resultados
Considerando a especificidade e as peculiaridades da populao envolvida neste

estudo, v-se que os achados, apesar de certas diferenas quantificveis dos encontrados
por Davis, so condizentes com seu estudo.
45
6 CONCLUSES
O comportamento gaussiano das distribuies encontradas para todos os

parmetros avaliados justifica a amostragem realizada. Isto , uma amostra de 130
voluntrios representativa da populao regional.
O valor da mdia encontrado neste estudo relativo a freqncia fundamental do
sexo feminino encontra-se em concordncia com os achados de Behlau e Pontes, no
entanto o mesmo no ocorreu com os achados relativos freqncia fundamental do
sexo masculino.
O critrio adotado para estabelecimento dos limiares foi o valor que abrange
pelo menos 70% da amostra. Assim, os limiares propostos como padronizadores de
normalidade e as porcentagens associadas so: jitter 3% (70,8%), shimmer 10%
(75,4%), SFR 9 dB (76,9%) SFF 10,28 dB (72,3%), P.A 0,52 (73%) e EX 6,5
(73,8%).
O programa utilizado neste trabalho comportou-se de maneira promissora, visto
que no apresentou nenhum falso positivo, fato que corroborou com os achados clnicos
e perceptivos.
No houve investigao relacionada s vozes patolgicas devido ao no
aparecimento de tais amostras durante este estudo, apesar da aleatoriedade dos
voluntrios. Tal fato descartou a averiguao de um provvel falso negativo. Fica
proposto para trabalho futuro, o estudo comportamental da distribuio destes dados.
46
7 REFERNCIAS BIBLIOGRFICAS
ANDRADE, L. M. O., VIEIRA, J. M., RAZERA, D. E., GUERRA, A. C., PEREIRA, J.

C. Medidas de Perturbao da voz: um novo enfoque. Revista FonoaudiologiaBrasil, Braslia-DF, v.2, n.2, p.39-46, 2002.
ARONSON, A.E. Clinical Voice Disorders. New York, Decker, 1980.
ARONSON, A.E. Clinical Voice Disorders. 3rd ed. New York: Thieme, 1990.
BEHLAU, M.& PONTES, P. Avaliao e Tratamento das Disfonias. So Paulo:
Lovise, 1995.
BEHLAU, M. & REHDER, M.I. Higiene Vocal para o Canto Coral. Rio de Janeiro:
Revinter, 1997.
BEHLAU, M. (org). Voz O Livro do Especialista. Rio de Janeiro: Revinter,2001.
BOONE, D. & MCFARLANE, S. The Voice and the Voice Therapy. 4 ed.
Englewood Cliffs, Prentice-Hall, 1988.
BRANDI, E. Voz Falada: Estudo, Avaliao e Tratamento. Rio de Janeiro: Atheneu,
1990.
DANGELO, J.G. & FATTINI, C.A. Anatomia Humana Sistmica e Segmentar. 2ed,
Atheneu, 1995.
DAVIS, S.B. Acoustic Characteristics of Normal and Pathological Voices. In Lass,
N.J. (ED) Speech and language: Advances in Basic Research and Pratice, vol.1, New
York Academic Press, 271-335, 1979.
FROKJAER-JENSEN, B. & PRYTZ, S. Registration of Voice Quality, B & K
Technical Review, 3-17, 1976.
FUKAZAWA, T. EL-ASUOOTY, A E HONJO, I. A New Index for Evaluation of the
Turbulent Noise in Pathological Voice. Journal of the Acoustical Society of America,
83, 1189-1193, 1988.
GARCIA-TABIA, R., COBETA, I. Clasificacin de Las Disfonas. In los
Transtornos de la Voz. Madrid: Garsi, 1996.
47
HILLENBRAND, J., CLEVELAND, R. A & ERICKSON, R. L. Acoustic Correlates

of Breathy Vocal Quality. Journal of Speech and Hearing Research, 37, 769-778,
1994.
HIRAOKA, N., KITAZOE, Y., UETA, H., TANAKA, S. E TANABE, M.HarmonicIntensity analysis of Normal and Hoarse Voices. Journal of the Acoustical Society of
America, 76, 1648-1651, 1984.
HIRANO, M. Structure and Vibratory Behaviour of the Vocal Folds. In M.
Saswashima and F.S. Cooper (Eds.), Dynamic Aspects of Speech Production. Tokio.
University of Tokio Press. 1977.
HOLMES, J. N. Low Frequency phase Distortion of Seepch Recording. The Journal
of the Acustical Society of America, 747-749, 1975.
KASUYA, H., OGAWA, S., MASHIMA, K. EBIHARA, S. Normalized Noise Energy
as na Acoustic Measure to Evaluate Pathologic Voice. The journal of the Acoustical
Society of America, 80, 1329-1334, 1986.
KOIKE, Y. Applications of Some Acoustic Measures for the Evaluation of
Laryngeal Dysfunction. Studia Phonologic, 7, 17-23, 1973.
KOJIMA, H., GOULD, W.J., LAMBIASE, A. E ISSHIKI, N. Computer Analysis of
Hoarseness, Acta Otolaryngologica, 89, 547-554, 1980.
KROM, G. Consistency and Reability of Voice Quality Ratings for Different Types
of Speech Fragments. Journal of Speech and Hearing Research, v.37, 985-1000, 1994.
KROM, G. Some Spectral Correlates of Pathological Breathy and Rough Voice
Quality for Different Types of Vowel Fragments. Journal of Speech and Hearing
Research, v.38, 794-811, 1995.
LIEBERMAN, P. Some acoustics Measures of the Fundamental Periodicity of
Normal and Pathologic Larynges, Journal of the Acoustics Society of America, 35,
344-353, 1963.
NIETO, A., DEL PALACIO, A. J., LORENZO, A. J., VEGAS, A., COBETA,I. Los
Ordenadores en el Anlisis de la Voz: Aplicaciones Clnicas. Acta
Otorrinolaringologica Espaola. V.46, n.4, 241-245, 1955.
PINHO, S. Avaliao e Tratamento da Voz. In Pinho (org): Fundamentos em
Fonoaudiologia. Tratando os Distrbios da Voz. Rio de Janeiro: Guanabara-Koogan,
2-48, 1998.
ROSA, M.O. Anlise Acstica da Voz para Pr-Diagnstico de Patologias da
Laringe. Dissertao (mestrado) Escola de Engenharia-Universidade de So Paulo.
So Carlos, 1998.
ROSA, M.O., PEREIRA, J.C., GRELLET, M. Signal Processing and Statistical
Procedures Identify Laryngeal Pathologies. 6th IEEE International Conference on
48
Electronics, Circuits and Systems (ICECS99) Advanced Program. Paphos,

Chipre,Set. 1999.
SHOJI, K., REGENBOGEN, E. YU, J.D., BLAUGRUND, S.M. High-frequency
Power Ratio of Breathy Voice. Laryngoscope, 102, 267-271, 1992.
TABITH, A.JR. Foniatria: Disfonias, Fissuras, Paralisia Cerebral. 7ed. So Paulo,
Cortez, 1995.
TAKAHASHI, H. E KOIKE, Y. Some Perceptual Dimensions and Acoustical
Correlates of Pathologic Voices. Acta Oto-laryngologica, Suppl.338, 1-24, 1975.
VONLEDEN, H., MOORE, G. P. The Mechanics of the Cricoarytenoid Joing. Arch
Otolaryngol. 73: 541-550. 1961.
ZEMLIN, W. R. Speech and Hering Science: Anatomy and Physiology. 3ed.
Englewood Cliffs, WJ: Prentice Hall, 1998.
YUMOTO, E., GOULD, W. J. E BAER, T. Harmonics-to-Noise Ratio as na Index of
the Degree of Hoarseness. Journal of the Acoustical Society of America, 71, 15441549, 1982.
ANEXO
HOSPITAL DAS CLNICAS DA FACULDADE DE MEDICINA DE

RIBEIRO PRETO DA UNIVERSIDADE DE SO PAULO
Campus Universitrio Monte Alegre Fone: 602.1000
CEP 14048-900 Ribeiro Preto So Paulo
TERMO DE CONSENTIMENTO PS-INFORMAO
NOME DA PESQUISA:
Determinao dos Limiares de Normalidade dos Parmetros Acsticos da Voz
PESQUISADOR RESPONSVEL:
Luciana Mara de Oliveira Andrade CRFa: 9959
ORIENTADOR RESPONSVEL:
Marcos Grellet CRM:10.069
INFORMAES AOS PACIENTES:

1.Os sujeitos que possurem problemas de laringe, podem apresentar alteraes
na voz, durante a gravao da mesma e posterior anlise no computador, fato que
necessita de averiguao para um melhor conhecimento.
2. A pesquisa a ser realizada, tem a finalidade de investigar a eficcia de um
programa de computador para voz, atravs da gravao da mesma, via
microfone/computador
e
exame
otorrinolaringolgico
denominado
videoestroboscopia, que consiste em filmar a laringe/garganta. A filmagem ser
realizada, utilizando-se um instrumento metlico, que ser introduzido dentro da
boca, no provocando nenhuma dor.
3. Os procedimentos no envolvem qualquer risco e, com o conhecimento
adquirido atravs da pesquisa, poder-se- verificar se existe possibilidade de prdiagnosticar problemas de voz com o uso de programa de voz computadorizado.
EU,________________________________________________________________
RG no :_______________________________, abaixo assinado, tendo recebido
as informaes acima, e ciente dos meus direitos abaixo relacionados, concordo
em participar.
1. A garantia de receber a resposta a qualquer pergunta ou esclarecimento a
qualquer dvida a cerca dos procedimentos, riscos, benefcios e outros
relacionados com a pesquisa;
2. A liberdade de retirar meu consentimento a qualquer momento e deixar de
participar no estudo sem que isso traga prejuzo minha pessoa;
3. A segurana de que no serei identificado e que ser mantido o carter
confidencial da informao relacionada com a minha privacidade;
4. O compromisso de me proporcionar informao atualizada durante o estudo,
ainda que esta possa afetar minha vontade de continuar participando;
5. O compromisso de que serei devidamente acompanhado e assistido durante todo
o perodo de minha participao na pesquisa;
6. Que se existirem gastos adicionais estes sero absorvidos pelo oramento da
pesquisa,
Tenho cincia do exposto acima e desejo participar desta pesquisa sob
orientao da fonoaudiloga que subscreve este documento.
Ribeiro Preto, _______de _________________________de ______.
Assinatura do paciente

Luciana Mara Oliveira

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Luciana Mara Oliveira

Uploaded by

Copyright:

Available Formats

Determinao dos Limiares de Normalidade dos

Parmetros Acsticos da Voz

Luciana Mara de Oliveira Andrade

Dissertao apresentada ao Programa de PsGraduao Interunidades em Bioengenharia /

Dedico este trabalho a DEUS que em

Ao Prof. Dr. Marcos Grellet pela dedicao e orientao, sem as quais no

3.2 PRODUO VOCAL

3.3 ANATOMIA VOCAL

3.4 FUNES DA LARINGE

3.4.1 Funo Respiratria

3.4.2 Funo Deglutitria

3.4.3 Funo Fonatria

3.5 ANATOMIA DAS PREGAS VOCAIS

3.6 VIBRAO DAS PREGAS VOCAIS

3.6.1 Freqncia Fundamental

3.6.2 Intensidade Vocal

3.6.3 Qualidade Vocal

3.7 PARMETROS ACSTICOS

3.7.1 Parmetros Acsticos no Domnio do Tempo

3.7.2 Parmetros Acsticos no Domnio da Freqncia

Figura 2: Esqueleto da Laringe

Figura 3: Sinal vocal no domnio do tempo

Figura 4: Sinal vocal no domnio da freqncia

Figura 5: Histograma da freqncia fundamental do sexo masculino

Figura 6: Histograma da freqncia fundamental do sexo feminino

Figura 7: Histograma do jitter

Figura 8: Histograma do shimmer

Figura 9: Histograma do SFR

Figura 10: Histograma do SFF

Figura 11: Histograma do P.A

Figura 12: Resduo de voz normal para o PA

Figura 13: Resduo de voz patolgica para o PA

Figura 14: Histograma do EX

Tabela 2: Tabela comparativa de resultados

RPK - Pearson r no pico de autocorrelao

direcionam para o mesmo diagnstico, um falso positivo, quando o referencial subjetivo

Determinar os valores mdios dos parmetros acsticos da voz: jitter, shimmer,

A avaliao subjetiva da voz iniciou-se no sculo XIX e essencial ao

freqentemente por mudanas na mesma. No entanto, esta avaliao pode receber

voclico do sinal digitalizado e eliminar os trechos no voclicos. Krom (1995),

3.2 PRODUO VOCAL

sistema respiratrio, adaptado a partir da respirao vital, tornando-se passiva na

Os sons voclicos so produzidos por pulsos de ar quase peridicos gerados na

3.3 ANATOMIA VOCAL

Figura 2: Esqueleto da Laringe

A tireidea a maior cartilagem da laringe e composta por duas lminas

A epiglote uma cartilagem em forma de folha fixada sobre a superfcie mesial

O msculo cricotireideo possui formato de leque e localiza-se entre as

3.4 FUNES DA LARINGE

3.4.1 Funo Respiratria

3.4.2 Funo Deglutitria

3.4.3 Funo Fonatria

3.5 ANATOMIA DAS PREGAS VOCAIS

3.6 VIBRAO DAS PREGAS VOCAIS

Outras alteraes, como paralisia dos msculos respiratrios, podem causar

Aronson (1980), classifica as disfonias em trs grupos principais: disfonias

3.6.1 Freqncia Fundamental

3.6.2 Intensidade Vocal

3.6.3 Qualidade Vocal

Vrios so os termos utilizados para conceituar a voz, levando assim a

3.7 PARMETROS ACSTICOS

Figura 3: Sinal vocal no domnio do tempo.

No domnio da freqncia, o sinal vocal analisado em suas componentes de

Ribeiro Preto, _de _____________de .