Professional Documents
Culture Documents
So Carlos SP
2003
AGRADECIMENTOS
SUMRIO
LISTA DE FIGURAS
LISTA DE TABELAS
II
LISTA DE ABREVIATURAS
III
LISTA DE SMBOLOS
RESUMO
ABSTRACT
VI
VII
1 INTRODUO
2 OBJETIVOS
3 REVISO DE LITERATURA
3.1 VOZ
12
12
13
13
13
14
17
18
18
20
21
24
4 METODOLOGIA
31
5 RESULTADOS E DISCUSSO
34
6 CONCLUSES
45
7 REFERNCIAS BIBLIOGRFICAS
46
LISTA DE FIGURAS
Figura 1: Posicionamento das pregas vocais
10
20
21
35
36
37
38
39
40
41
42
42
43
II
LISTA DE TABELAS
Tabela 1: Tabela com anlise estatstica
44
44
III
LISTA DE ABREVIATURAS
APQ - Quociente de perturbao de amplitude
Br - Razo de soprosidade
BRI - ndice soprosidade
CPP - Proeminncia de pulso cepstral
Et al - Colaboradores
EX - Coeficiente de excesso
F0 - Freqncia fundamental
Fc - Limiar de alta freqncia
FFT - Espectro por Transformao de Fourier
FPQ - Quociente de perturbao de freqncia
H/L - Razo da mdia da energia espectral menor que 4 kHz e maior/igual que 4 kHz
H1A - Relao entre o 1. harmnico e o 2. harmnico
HFPR - Relao de potncia em altas freqncias
HNR - Razo harmnico/rudo
Hr - Intensidade harmnica relativa
LTAS - Espectro mdio de longo termo
NNE - Energia do rudo normalizado
P/A - Relao entre a amplitude de pico pela amplitude mdia do valor absoluto do sinal
PA - Amplitude da autocorrelao do sinal residual
PFF - Fator de perturbao de pitch
PPQ - Quociente de perturbao do perodo de freqncia
ppvv - Pregas vocais
Ra - Razo da energia dos harmnicos
RAP - Perturbao mdia relativa da freqncia
IV
LISTA DE SMBOLOS
/a/ - Vogal a
/e/ - Vogal e
/i/ - Vogal i
dB - Decibis
Gb - Gigabyte
Hz - Hertz
Mb - Megabyte
p Nvel de Significncia do Teste Estatstico
VI
RESUMO
Existe uma gama de pesquisas destinada anlise digital da voz, cujo intento o
de propiciar ferramentas que possam auxiliar no processo diagnstico e teraputico. O
intercmbio entre engenharia e reas da sade, como medicina e fonoaudiologia, tem
apresentado expansiva importncia para um melhor entendimento e aprimoramento de
um saber mais comum, onde a aplicabilidade de dados quantitativos associados a
dados qualitativos acresce conhecimentos nestas duas vertentes.
O intuito deste trabalho o de utilizar dados quantitativos atravs de uma
ferramenta de anlise acstica da voz e avaliar sua acuracidade. Para tanto, fez-se
exames clnicos e avaliaes perceptivas em 130 voluntrios.
Os resultados obtidos conjuminam com a proposio deste estudo, sendo
expressivamente promissores com a exatido da inter-relao dos achados, com o qual
pode-se concluir a veracidade da ferramenta utilizada.
VII
ABSTRACT
The diagnosis and therapeutic process of the voice has incorporated digital voice
analysis as a useful tool for the specialists.
The interchange between engineering and health sciences has improved the
understanding of this interface area and the association between quantitative data and
qualitative evaluation enhanced both.
The purpose of this work is to use the acoustical analysis of voice in order to
evaluate how accurate is that tool compared with clinical and perceptual diagnostics. A
set of 130 subjects was used to evaluate this comparison.
The results are consistent and match favorably the clinic and perceptual
achievements.
1 INTRODUO
Para poder discorrer sobre a voz, faz-se necessrio situ-la enquanto elemento de
relevada importncia no processo de comunicao humana, visto que, um componente
da linguagem oral e , tambm, um dos principais vnculos do relacionamento entre as
pessoas.
A voz tem origem na laringe, ou seja, na vibrao das pregas vocais, decorrente
da passagem do fluxo areo originado nos pulmes. Esta voz, ento produzida, possui
caractersticas prprias que variam de acordo com o sexo, a pessoa e com a faixa etria,
alm de refletir o estado e o comportamento larngeos, caracterizando o que se chama
de qualidade vocal. Assim, v-se que pela qualidade vocal, pode-se conhecer e/ou
inferir sobre as condies antomo-fisiolgicas das estruturas larngeas.
Devido complexidade da voz, as avaliaes subjetiva e objetiva so
importantes para descrev-la. Essas avaliaes podem ser utilizadas como meio de
auxlio no diagnstico e no tratamento das doenas que acometem a laringe.
Alm de ser a primeira ferramenta de um clnico, a avaliao perceptivo-auditiva
vocal, ou seja, aquela realizada subjetivamente, fundamental e insubstituvel por ser a
mais acessvel e no necessitar de aparatos. O que no descarta a importncia das
avaliaes objetivas, pois estas se complementam com as subjetivas dando mais
consistncia s constataes clnicas. Para isto, o confronto de achados perceptivos e
acsticos faz-se necessrio, estabelecendo-se, portanto, em casos em que ambos no
2 OBJETIVOS
3 REVISO DE LITERATURA
3.1 VOZ
resultados. Nota-se que a evoluo da tecnologia propicia uma apurao bem mais
minuciosa das alteraes na voz.
Para melhor diagnosticar alteraes vocais, existe uma mirade de ferramentas e
pesquisas disponveis, que devem ser utilizadas por especialistas que tratam da voz.
Mais que interesse cientfico, o foco do clnico est no aprimoramento dos resultados do
diagnstico e do tratamento. Pelo uso seletivo de medidas relevantes, estas podem ser
usadas como realimentao na melhoria de tcnicas de tratamento.
Dentre as ferramentas, a anlise acstica da voz, devido a sua objetividade, tem
expressiva utilizao. A evoluo histrica da mesma, descrita em dcadas, facilita a
compreenso dos fatos marcantes (BOONE E MACFARLANE, 1988). Seu
desenvolvimento se deve, em grande parte, evoluo da tecnologia atravs dos estudos
no campo da Engenharia.
Na dcada de 20, a anlise acstica da voz era realizada utilizando oscilogramas
por meio da visualizao de ondas ou grficos de amplitude pelo tempo.
Na dcada de 40, iniciou-se a utilizao da Anlise de Fourier com Anlise de
Henrici para obteno da anlise espectral.
Na dcada de 50, o Espectrgrafo surgiu revolucionando a metodologia de
anlise da voz atravs do espectrograma que uma gravao visual tridimensional da
distribuio de energia em freqncia, tempo e intensidade.
Na dcada de 70, o processamento digital de sinais revolucionou o estudo da voz
Os programas permitiram anlises combinadas no domnio do tempo e da freqncia.
Foram
produzidos
os
Espectrogramas
Digitais
Programas
de
Anlise
Computadorizados da Voz.
Davis (1979), coloca que a avaliao perceptivo-auditiva da voz fornece
informaes sobre a qualidade vocal, visto que, patologias larngeas so acompanhadas
Figura 1: Posicionamento das pregas vocais durante a produo vocal (A) e durante a respirao (B)
(adaptao de http://www.gastroweb.com.br/imgend/laringe.htm, acessado em 12/04/03)
Portanto, do ponto de vista de anlise do aparato vocal, este modo de gerao de voz
contm toda a informao fisiolgica sobre o sistema.
puxam o
osso
hiideo,
conseqentemente a laringe, para frente. O ventre posterior do digstrico e do estilohiideo quando contrados puxam o hiideo posteriormente.
No grupo infra-hiideo os msculos esternotireideo, esterno-hiideo e o omohiideo, quando contrados, puxam a laringe para baixo. O msculo tiro-hiideo
contribui para determinar o ngulo da cartilagem tireidea com relao cartilagem
cricidea.
Segundo Dngelo e Fattini (1995), a ao dos msculos supra-hiideos com os
infra-hiideos mantm o osso hiideo, propiciando uma base firme para os movimentos
da lngua.
O esqueleto da laringe (Figura 2) composto de cartilagem hialina, sendo as
mais importantes s cartilagens tireideas, cricidea e aritenideas.
10
Epiglote
Osso Hiideo
Ligamento Tireohiideo
Osso Hiideo
Ligamento Tireohiideo
Epiglote
Cartilagem Tireidea
Cartilagem Tireidea
Cartilagem Cricidea
Cartilagens Aritenideas,
Cuneiformes e
Corniculadas
LARINGE
11
12
13
14
A lmina prpria, por sua vez, pode ser dividida em trs camadas: superficial,
intermediria e profunda (HIRANO, 1977). A camada superficial, freqentemente
referida como espao de Reinke, frouxa e flexvel, sendo essa camada que vibra mais
intensamente durante a fonao. A camada intermediria consiste principalmente de
fibras elsticas e a profunda composta de fibras de colgeno podendo ser comparadas
s linhas de algodo. Por no haver um limite definido entre as camadas intermediria e
profunda, d-se o nome de ligamento vocal juno destas, sendo que o nmero de
fibras elsticas diminuem e as de colgeno aumentam em direo ao corpo da prega
vocal.
O corpo da prega vocal composto pelo msculo vocal e quando esse se contrai,
funciona como um feixe de elsticos muito rijo. No h uma delimitao entra as fibras
colgenas da camada profunda e as fibras mais superficiais do msculo vocal.
As estruturas descritas podem ser agrupadas em trs sees: a cobertura,
(consistindo do epitlio e da camada superficial da lmina prpria); a transio
(compostas pelas camadas intermediria e profunda da lmina prpria); e o corpo
(composto do msculo vocal).
Durante a fonao, o deslocamento da cobertura apresenta uma componente
vertical contraria a gravidade produzindo um movimento elipsoidal, enquanto que o
corpo oferece estabilidade e o tono muscular de base. A transio, por sua vez, serve de
acoplamento entre a camada superficial e o msculo vocal (BEHLAU, 2001).
15
16
17
uma leso secundria, como por exemplo, o ndulo vocal; e disfonias orgnicas, cuja
etiologia independe do uso da voz e advm de quadros inflamatrios ou infecciosos,
gripes e laringites, alteraes vocais por carcinoma da laringe e ou doenas neurolgicas
como doena de Parkinson e Esclerose Lateral Amiotrfica.
Por haver vertiginosa aceitao no meio fonoaudiolgico adotar-se-, neste
trabalho, a classificao ditada por (BEHLAU E PONTES, 1995).
De qualquer forma, os sintomas acsticos percebidos durante o processo
patolgico da laringe so mudanas na freqncia fundamental, na intensidade da voz
ou em sua qualidade. Esses sintomas so indicativos de alteraes orgnicas e/ou
funcionais e a natureza desses sintomas varia para cada paciente e tambm com o
estgio da patologia.
18
pessoas que apresentam tamanho, sexo e idade similar. Nos distrbios funcionais que
envolvem alta freqncia, as pregas vocais so muito exigidas no ponto de mximo
deslocamento. Este abuso vocal pode produzir laringite, causando o desenvolvimento de
ndulos, ou agravando uma patologia existente.
19
BEHLAU, M.& PONTES, P. Avaliao e Tratamento das Disfonias. So Paulo: Lovise, 1995.
20
vocais durante a produo vocal; voz spera, que ocorre quando h reduo ou ausncia
da onda de mucosa que reveste as pregas vocais; voz soprosa, correspondente
presena de rudo de fundo, audvel.
Esta viso de uma abordagem simplista somente tem o intuito de propiciar aos
profissionais da rea e reas afins uma unificao de termos, no desmerecendo os
pesquisadores, nem se atendo idia reducionista.
21
22
maiores perturbaes de freqncia que sujeitos com vozes normais, com o mesmo
perodo mdio fundamental. O fator de perturbao sensvel ao tamanho e
localizao da alterao tecidual patolgica na laringe do sujeito. Para Lieberman,
leses na lmina prpria causam perturbaes menores que leses no msculo.
Koike (1973), desenvolveu a medida RAP (perturbao mdia relativa da
freqncia), que considera as estruturas supraglotais, pois conforme o autor, o contato
do microfone com a garganta o melhor indicador da aperiodicidade larngea. Em
ltima anlise uma dessensibilizao do perodo, atravs de uma filtragem passabaixas, usando o valor mdio e o janelamento de trs perodos da freqncia.
Em Takahashi e Koike (1975), as vozes ditas patolgicas so percebidas como
rouca, spera e soprosa, porm no so pertinentes para um diagnstico mais preciso.
Para elucidar um diagnstico por meio da voz, alguns estudos perceptivos so
necessrios. E um dos procedimentos propostos por Osgood* (1957), citado pelos
autores, a tcnica diferencial semntica. Esta tcnica tem sido utilizada por muitos
pesquisadores para estudar a impresso auditiva da voz e da fala humana. So
considerados quatro fatores perceptivos: fluidez, rouquido, magnitude e extenso
vocal, sendo que culturas de lnguas diferentes no interferem no resultado, ou seja, a
percepo a mesma. Aps terem feito uma anlise perceptiva, fizeram uma
comparao por meio de tcnicas acsticas envolvendo freqncia fundamental (F0),
quociente de perturbao de freqncia (FPQ) e quociente de perturbao de amplitude
(APQ) dos trechos mais estveis da vogal /a/, sustentada durante, aproximadamente, 1,5
segundos e captadas pelo microfone de contato. O parmetro FPQ foi definido como a
perturbao mdia normalizada do perodo da freqncia pico-a-pico e o APQ como a
23
DAVIS, S.B. Acoustic Characteristics of Normal and Pathological Voices. In Lass, N.J. (ED) Speech
and language: Advances in Basic Research and Pratice, vol.1, New York Academic Press, 271-335, 1979
24
25
26
(HNR) com a razo sinal/rudo (S/N) proposta por Kojima et al. (1980) e verificaram
que os valores encontrados em dB para (S/N) foram maiores que os encontrados para
(HNR) e justificaram esta discrepncia devido a diferena metodolgica entre os dois
estudos. O coeficiente de correlao de Spearman foi 0,849 e significante com p=0,001,
o que confirmou que a HNR foi um ndice til para avaliar quantitativamente o
componente ruidoso relativo ao componente harmnico da vogal, mas afirmaram a
necessidade de estudos futuros para confirmar a relao entre a HNR e as medidas
psicofsicas do grau de rouquido.
No estudo de Hiraoka et al. (1984), o tempo de intervalo para anlise foi fixado
independentemente, sendo a freqncia fundamental e a freqncia harmnica
determinadas automaticamente pela Transformada de Fourier. A avaliao objetiva foi
realizada considerando as caractersticas de vozes roucas, que mostraram a intensidade
da freqncia fundamental mais proeminente, comparada com os harmnicos do
espectro vocal, conforme afirmao dos autores. A intensidade harmnica relativa (Hr),
obtida por meio de uma poro estvel da vogal /a/ sustentada, denota a porcentagem
das intensidades das componentes harmnicas relativas a intensidade vocal total. Os
autores estabeleceram um limite de 67,2% para Hr como discriminador entre vozes
normais e patolgicas. Das vozes normais examinadas, 95% tiveram a intensidade
harmnica maior que o valor crtico de 67,2%, enquanto que 90% das vozes roucas
tiveram a intensidade harmnica menor que o valor crtico.
Kasuya et al. (1986), desenvolveram uma medida de energia do rudo
normalizado (NNE) que estimou os componentes ruidosos da fonao de uma vogal
sustentada e propuseram uma medida acstica para a deteco de patologias larngeas.
O sinal vocal foi filtrado atravs de um filtro pente adaptativo operando no domnio da
freqncia. Basearam-se em um sinal de voz com janelamento de 7 perodos de uma
27
28
29
apresentar faixas de valores diferentes para o ndice HPFR a partir de Fc igual a 4 kHz e
a 6 kHz, regies em que no ocorreram sobreposies. Concluram que para Fc (6 kHz)
o limite de separabilidade entre vozes normais e soprosas 30 dB. Alm disso, o
ndice HFPR , tambm, uma ferramenta til para a avaliao de fonocirurgia.
Hillenbrand et al. (1994), mediram a relao entre as avaliaes de soprosidade e
uma gama de medidas acsticas. Estas medidas enquadraram-se em 3 categorias: a)
medidas da periodicidade do sinal; b) medidas da amplitude do primeiro hamnico e c)
medidas de inclinao espectral. A amostra foi constituda por 8 homens e 7 mulheres
na faixa etria de 22 a 37 anos de idade sem relato de problemas vocais, de fala ou de
audio. Cada falante foi treinado a produzir 3 variaes vocais (normal,
moderadamente soprosa e muito soprosa), das quais se estimou a mdia da freqncia
fundamental. Esta freqncia foi calculada a partir da leitura de um trecho do texto
Rainbow Passage (FAIRBANKS, 1940), processado pelo equipamento Visi-Pitch da
Kay Elemetrics/interface IBM PC (HORII, 1983). Incluiu-se, ainda, as vogais [a], [I],
[] e [o] , sustentadas por, aproximadamente, 3 segundos, perfazendo um total de 12
amostras voclicas (4 vogais x 3 variaes vocais). Vinte ouvintes, estudantes de
graduao de Patologias da Fala-Linguagem (Universidade de Michigan), foram
recrutados para avaliar as amostras voclicas, aps terem realizado audiometrias
(freqncias 0,5; 1; 2; 4 e 6 kHz). Na anlise acstica utilizou-se a proeminncia de
pulso cepstral (CPP), que a distncia do pico reta de regresso linear normalizado
para todas as amplitudes; o Pearson r no pico de autocorrelao ( RPK); a relao entre
a amplitude de pico pela amplitude mdia do valor absoluto do sinal (P/A); o indice de
soprosidade (BRI), que consiste na media do Br em janelas de 25,6 ms com passo de 10
ms do sinal; a razo da mdia da energia espectral na faixa menor que 4 kHz e
maior/igual que 4 kHz (H/L), que uma modificao do HFPR, com o limiar de
30
31
4 METODOLOGIA
32
(LIM/SEL/EESC/USP).
Neste
local,
realizou-se
anlise
acstica
33
Na anlise, cada amostra vocal do /a/ sustentado teve seus trechos inicial e final
desprezados, conforme estudos de Krom (1995), considerando-se apenas o tero mdio
da emisso. Este teve a durao de 30 janelas de 512 pontos, o qual corresponde a 696,6
ms. Essa durao de tempo decorrente da freqncia de amostragem usada (22.050).
De acordo com este programa de anlise vocal, determinou-se os seguintes
parmetros sobre o sinal vocal: jitter (em %), shimmer (em %), suavidade espectral do
filtro (SFF, em dB), suavidade espectral do sinal resdual (SFR, em dB), ndice de
vocalizao (PA em valor absoluto) e coeficiente de excesso (EX, em valor absoluto).
Todos os voluntrios passaram, ainda, por uma inspeo de videoestroboscopia
no HC/FMRP/USP realizada por profissional habilitado. Durante esta inspeo,
solicitou-se que cada um dos voluntrios emitisse a vogal sustentada /i/ durante o tempo
que o profissional julgasse necessrio para esta avaliao. Ainda este profissional, no
final desta avaliao, fornecia o diagnstico das ppvv avaliadas para o voluntrio ao
mesmo tempo que confrontava seus achados clnicos com a avaliao perceptivoauditiva, realizada anteriormente.
A pesquisadora anotou, ento, junto sua avaliao perceptivo-auditiva, o
resultado clnico da inspeo videoestroboscpica para comparaes posteriores.
34
5 RESULTADOS E DISCUSSO
35
de 28%
referente ao valor mdio citado por Bhelau e Pontes (1995), o valor mdio resultante
encontrado foi de 128,65 Hz com desvio padro de 20,75 Hz.
Algo que chama a ateno a distribuio mais dispersa do pitch masculino em
relao ao feminino (figura 6). No se encontra na literatura estudos a respeito de tal
ocorrncia. Considerando-se esta amostra representativa da populao, este fato pode
requerer maiores investigaes.
16
14
12
porcentagem
10
0
88,338
95,642
102,947
110,251
117,556
124,860
132,165
139,470
146,774
154,079
161,383
168,688
175,992
intervalos
que a
36
50
45
40
35
porcentagem
30
25
20
15
10
0
162,076
172,444
182,811
193,178
203,545
213,913
224,280
234,647
245,015
255,382
265,749
276,116
286,484
intervalos
37
Para o Jitter, Davis encontrou em seus estudos os valores de 0,99% para a mdia
e desvio padro 2,28%. Independentemente das amostras vocais selecionadas, os
resultados esto bastante prximos daquele estudo.
40
35
30
porcentagem
25
20
15
10
0
0,000
0,488
1,345
2,201
3,057
3,914
4,770
5,626
6,483
7,339
8,195
9,052
9,908
intervalo
38
60
50
porcentagem
40
30
20
10
0
2,487
4,893
7,300
9,706
12,112
14,519
16,925
19,331
21,738
24,144
26,550
28,957
31,363
intervalo
39
30
25
porcentagem
20
15
10
0
-17,588
-16,512
-15,435
-14,359
-13,283
-12,206
-11,130
-10,054
-8,977
-7,901
-6,825
-5,748
-4,672
intervalos
40
35
30
porcentagem
25
20
15
10
0
-23,947
-22,333
-20,720
-19,106
-17,492
-15,879
-14,265
-12,651
-11,038
-9,424
-7,810
-6,197
-4,583
intervalos
41
35
30
porcentagem
25
20
15
10
0
0,183
0,237
0,292
0,346
0,401
0,455
0,510
0,565
0,619
0,674
0,728
0,783
0,837
intervalos
42
43
60
porcentagem
50
40
30
20
10
0
-0,935
5,055
11,045
17,035
23,025
29,015
35,005
40,995
46,985
52,975
58,965
64,955
70,945
intervalos
44
SIMETRIA
CURTOSE
Jitter
11,5541
72,5008
Shimmer
113,1123
2276,9625
SFR
1,7130
55,9840
SFF
-14,1819
380,5350
PA
-0,0012
0,0006
EX
350,5444
7499,6247
DAVIS
ANDRADE
Jitter
0,99 2,28
1,99 2,16
Shimmer
7,22 4,47
9,17 3,17
SFR
-10,50 2,50
-10,91 2,13
SFF
-11,85 1,84
-12,73 3,41
PA
0,725 0,105
0,579 0,116
EX
5,17 4,29
9,50 5,60
45
6 CONCLUSES
46
7 REFERNCIAS BIBLIOGRFICAS
47
48
ANEXO
NOME DA PESQUISA:
Determinao dos Limiares de Normalidade dos Parmetros Acsticos da Voz
PESQUISADOR RESPONSVEL:
Luciana Mara de Oliveira Andrade CRFa: 9959
ORIENTADOR RESPONSVEL:
Marcos Grellet CRM:10.069
EU,________________________________________________________________
RG no :_______________________________, abaixo assinado, tendo recebido
as informaes acima, e ciente dos meus direitos abaixo relacionados, concordo
em participar.
1. A garantia de receber a resposta a qualquer pergunta ou esclarecimento a
qualquer dvida a cerca dos procedimentos, riscos, benefcios e outros
relacionados com a pesquisa;
2. A liberdade de retirar meu consentimento a qualquer momento e deixar de
participar no estudo sem que isso traga prejuzo minha pessoa;
3. A segurana de que no serei identificado e que ser mantido o carter
confidencial da informao relacionada com a minha privacidade;
4. O compromisso de me proporcionar informao atualizada durante o estudo,
ainda que esta possa afetar minha vontade de continuar participando;
5. O compromisso de que serei devidamente acompanhado e assistido durante todo
o perodo de minha participao na pesquisa;
6. Que se existirem gastos adicionais estes sero absorvidos pelo oramento da
pesquisa,
Tenho cincia do exposto acima e desejo participar desta pesquisa sob
orientao da fonoaudiloga que subscreve este documento.
Assinatura do paciente