You are on page 1of 20

WDCOPIN 2012

Anlise Acstica de patologias da fala (VOICECLIN)


Mestrando Srgio de Brito Espinola Cincia da Computao LAD/COPIN/UFCG Orientadores: Prof. Dr. Elmar Uwe Kurt Melcher, Prof. Dra. Joseana Macdo Fechine Rgis de Arajo

Agenda
Contexto da Pesquisa
Problema Relevncia Motivao

Objetivo
Materiais e mtodos Resultados Preliminares

Consideraes Finais e Trabalhos Futuros


Fonte Figura microfone : Microsoft Office: mac, Clipart, HOME & STUDENT, 2011. Campina Grande, 8 de Maio de 2012

Srgio Espinola LAD/COPIN/CEEI/UFCG

Voz, Economia e Sociedade


Instrumento natural de Comunicao;

Um tero (1/3) da fora de trabalho produtiva

depende da Voz para seus ofcios


Esses profissionais podem ser

(FRAILE et ali 2009);

classificados em:

(SDERSTEN 2007)

Instrutores, Intrpretes, Persuasivos, Profissionais de emergncia.

Campina Grande, 8 de Maio de 2012

Fonte Fotos: Religioso: http://www.pletz.com/blog e Aula: http://morgadodeontologia.blogspot.com

Voz, Economia e Sociedade II


3 a 10% dos americanos tero

algum problema relacionado a fala durantes suas vidas;


~60 % dos professores podem

ter problemas de voz no Brasil


(ZAMBOM; BEHLAU, 2010).

Em 29 de outubro, Lula foi diagnosticado com cncer de laringe aps passar por exames no Hospital Srio-Libans, em So Paulo. Revista Veja
Populao de Professores PT-BR: Cerca de 2,4 milhes (Educao Bsica 2 mi) Mulheres representam 81,5 % do total amostrado

Dados de 1651 professores da rede bsica de ensino e 1614 pessoas da populao em geral Dados MEC/INEP (ZAMBOM, BEHLAU 2010):
Disponvel em <http://www.rbep.inep.gov.br/index.php/RBEP/article/viewFile/474/487>

Reportagem sobre Lula: <http://veja.abril.com.br/noticia/brasil/lula-divulga-foto-sem-barba-e-cabelo>

Problema na Voz e Questes sobre seu Diagnstico


Procedimentos
1. Paciente: Procurar Otorrino ou Fonoaudilogo;
2. Especialista mdico dever:

Escutar diretamente a voz do paciente; Inspecionar (direta ou indireta) por meio de exames das pregas vocais.

+Consideraes Levantadas
1. Anlises subjetivas (experincia do especialista). Impreciso e ambiguidade nos diagnsticos! 2. Exames so custosos (equipamentos e reagentes) /desagradveis (invasivos). Falta de estmulo ou declnio total para consulta e constrangimentos!
4
Fonte Figura microfone: Microsoft Office: mac, Clipart, HOME & STUDENT, 2011. Fonte Figura exame: http://midwestearnosethroat.com/services/throat

Objetivo

Modelar um sistema para apoiar o Diagnstico Clnico da Voz (Voice), por meio da anlise acstica, para identificar um conjunto de patologias da fala
Campina Grande, 8 de Maio de 2012

Estudo
Caracterizao de um Sistema de Processamento digital de sinais de Voz (PDSV) para classificao automtica de um conjunto de Patologias Vocais.
Terapia vocal, cirurgia e, em alguns casos, radioterapia
(MARTINEZ & RUFINER, 2000).

Fala do Paciente
VOICECLIN
Campina Grande, 8 de Maio de 2012

Indicar um Diagnstico (Patologia)

Srgio Espinola LAD/UFCG

Motivao
1. Diagnstico precoce - quase sempre
Chances de cura (carcinoma na laringe *): Tumor em estgio inicial mdio avanado

favorvel recuperao do paciente;


acima de 90% de 40% a 70% abaixo de 20%

2. Sinalizar um diagnstico por meio de uma

gravao local (prpria voz) pode alcanar um grande pblico.

Exemplo: Sistema em Computador ou num dispositivo porttil (celular, smartphone ou tablet).


* Fonte: http://g1.globo.com/bemestar/noticia/2011/10/cancer-de-laringe-que-atinge-lula-acomete-5-homens-para-cada-mulher.html
Srgio Espinola LAD / COPIN / UFCG
Campina Grande, 12 de dezembro de 2011

sergiodbe@lad.dsc.ufcg.edu.br

Motivao II
3. No existe ainda um consenso dos cientistas

a respeito da:

Modelagem mais apropriada para caracterizar uma

determinada patologia; Definio dos descritores acsticos (Fo, Pitch, etc) bons na discriminao de determinada (s) Patologia (s);

4. Acesso a uma base de dados relevante e

tambm usada por outros pesquisadores no Mundo.


Srgio Espinola LAD / COPIN / UFCG

Campina Grande, 12 de dezembro de 2011

sergiodbe@lad.dsc.ufcg.edu.br

Materiais e Mtodos I
Figura 2.5 - Modelo do trato vocal (RABINER and SCHAFER, 1978).

O trato nasal comea na vula e termina nas narinas. Quando a vula

Objetos da pesquisa:
Exame da Fala (Voz):
fonema /a/ gravado,

abaixada, o trato nasal acusticamente acoplado ao trato vocal para produzir os sons nasais da voz. Na Figura 2.6, apresentado um diagrama em blocos da produo de voz humana (DELLER, PROAKIS & HANSEN, 1993), tambm denominado sistema fonte-filtro, em que as dobras vocais so consideradas a fonte sonora e o trato vocal, o filtro. Nesse modelo, as sadas produzem ondas acsticas que representam a voz humana (RABINER e JUANG, 1993).

Diagnsticos de Patologias.

Necessrio citar o

Contexto da Produo da Voz


Est relacionado Laringe, faringe, lngua, palato, lbios e s estruturas relacionadas (pulmo, pregas ou dobras vocais, etc). A articulao destes mecanismos/estruturas produz sons particulares que, de forma simplificada, sero tratados como vozes.

Figura 2.6 - Um diagrama de blocos DA PRODUO DA VOZ HUMANA Figura UM DIAGRAMA DE BLOCOS da produo de voz humana.

(COSTA, 2008)

Materiais e Mtodos II
Base: 209 Vozes
Gravao da Fonao da

Vogal sustentada \a\

Durao mdia: 1-3 s Sexo: F=136; M=73 Respaldo: Estudo de profissionais

mdicos e especialistas em voz do Hospital-Enfermaria de Olhos, Ouvido e Garganta de Massachusetts/USA MEEI (KAY, 1994)

Fonte Figura WORKSHOP ON ACOUSTIC ANALYSIS, TITZE, Ingo R. PH.D. Page 9.

10

Materiais e Mtodos III


Anlise Acstica

Definio,
Representao da Voz, Qualidade Vocal, Descritores Acsticos

Ferramentas

AA: WaveSurfer, Praat; Edio de udio: Audacity; Software Estatstico: R, Matlab ; Classificao e Testes: WEKA , Java ;

Planilhas: Excel , LibreOffice.

Fonte Figura WORKSHOP ON ACOUSTIC ANALYSIS.. Page 9.

11

Resultados Preliminares I
Diagnsticos Confirmados com especialista:
1. Normal
2.

Patologias (dez)

Campina Grande, 8 de Maio de 2012

12

Srgio Espinola LAD/COPIN/CEEI/UFCG

Resultados Preliminares II
2.

Estudos de Caso (UC)


I.

UC1: Da Presena de Patologias


Normal X Patolgica: Sucesso esperado (Cerca de 100% de CA)!
A no-normalidade na produo da fala (patologia) est associada ao
aparecimento da no-estacionariedade do sinal produzido na fonao sustentada. Efeitos: Mudanas de Amplitude, rudo de turbulncia, etc.

II. UC2: Dentre Patologias,

Identificar qual est presente na fala.


Sucesso de cerca de 60% (ainda baixo). Classificador: Redes neurais Artificiais, MLP, Diversas configuraes testadas.

3.

Prottipo de Aplicao de voz no iPhone/iPad (c): registro e armazenamento da fala.


13

Campina Grande, 8 de Maio de 2012

Validao: Exemplo
Descritor acstico
Separao de Vozes Normais() / Patolgicas() (y=60%)

14
Srgio Espinola LAD/COPIN/CEEI/UFCG

Validao II: Contraexemplo


Frequncia

Fundamental Mdia: Fo
Descritor no til para a Classificao Pretendida.
Uma Linha no separa Normal / Patolgica ! Para todas vozes, eixo X, variao de Fo a mesma (entre 60 Hz e 350 Hz).

Normais

Patolgicas

Campina Grande, 8 de Maio de 2012

15

Srgio Espinola LAD/COPIN/CEEI/UFCG

Consideraes Finais
Aps a anlise e confirmao recente (abril) dos

diagnsticos das Patologias por especialista mdico, a pesquisa segue em novo ritmo de decobertas e resultados;
estatstica/inferencial, anlise multivariada dos fatores (cerca de 20 descritores acsticos), tcnicas de PDSV e de Inteligncia Artificial para a separao das classes de patologias pretendidas, etc.
Srgio Espinola LAD / COPIN / UFCG

O Foco passou para a investigao

Campina Grande, 12 de dezembro de 2011

16

sergiodbe@lad.dsc.ufcg.edu.br

Validao em Curso:

Anlise de Componentes Principais


Objetivos:
Identificar as principais fontes de variao

(PCA)

de dados complexos (muitas variveis); (grficos simples): Ex. Pareto.

Tornar as informaes interpretveis

Comp. {1-2} podem explicar quase 65% da variabilidade total

17

Trabalhos Futuros
Finalizar o Relatrio com Sntese dos

Experimentos e Grficos da PCA anterior;


Cruzar as Anlises PCA;
Conhecer bem a influncia estatstica desses descritores acsticos

para classificao;
Leia-se matematicamente efetivo para as mtricas de sucesso.

Revalidar com alguns desses melhores;

18

Obrigado!
mais recndito do ser, nossa condio primeira, nossa autenticidade maior e a sonora expresso da nossa verdade Edme Brandi
A voz revela, l do

Mestrando: Srgio de Brito Espinola


Cincia da Computao LAD/COPIN/UFCG
Contatos: sergiodbe@lad.dsc.ufcg.edu.br
http://twitter.com/sergiodbe

Campina Grande, 8 de Maio de 2012

19

LAD/COPIN/CEEI/UFCG

You might also like