You are on page 1of 18

| 


O
   
    

Débruitage perceptuel de la parole

’  ’
 
    :   

3 
  


x  lan de la présentation

1 Introduction
2 oints durs
3 La perception auditive
4 Le débruitage perceptuel de la parole
5 Résultats
^ Conclusion et perspectives

x
 
ubjectifs du débruitage de la parole

 



‡ Restituer le signal de parole dans les environnement bruités


‡ Améliorer l¶intelligibilité de la parole
‡ Le confort d¶écoute de l¶auditeur

Applications:
Reconnaissance de la parole
Téléphonie mobile
Téléphonie main libre«
ë
Les méthodes usuelles
 

Soustraction Viltrage de
Méthodes à spectrale Kalman
sous-espaces

  undelettes
Viltrage de 

Wiener

.........etc


Système mono capteur
 


O

1- Bruit additif s(n) y(n)


u

b(n)

2- Décorrélation entre bruit b(n) et parole propre s(n).


^ 
oints durs

‡ Estimation du bruit.
‡ Détection de l¶activité vocale (DAV).
‡ Artéfacts: Bruit musical et Distorsions du signal après débruitage.

^
Bruit musical?
- 



Gênant à la perception
humaine

Solution:
Tenir compte des propriétés du système auditif humain.

-
Système auditif
 

Coupe générale de l¶oreille

G
L¶effet de masquage?
Þ 

un parle de masquage quand un son est rendu inaudible par un autre.

Le masqueur élève localement le seuil d¶audition, le son cible


nécessite alors plus d¶énergie pour être perçu.
Þ

  
    
 

Contexte: rise en compte des propriétés de l¶audition humaine via la


modélisation de certaines de ces propriétés déterminantes.

Astuces : Distinction entre ce qui est audible et ce qu¶il ne l¶est pas.

uutil : Modélisation du phénomène de masquage par le calcul de la courbe


de masquage.

ubjectif: Diminuer les artéfacts (distorsions, bruit musical,«)

Ô
 

uissance Courbe de
du signal masquage

ortions inaudibles

ÔÔ
2  
 
    O
x 
dB dB
70

60

50

40

DS du signal
bruité 30

Courbe de
masquage idéale
20 Sous estimation
de la courbe
f(Hz) de masquage f(Hz)
10
0 1000 2000 3000 4000 5000 6000 7000 8000

Le bruit résiduel Les distorsions du signal


augmente augmentent

   


15
 
{    




( Y)   ( Y ) ( Y) m   ? 

Loizou[2] Lin[4]
 2
 2  ?

 1  min( , 1)  2 ?  max( 2 ú ? , 0)
?
m
Tim Haulik[5] (même ordre d¶idée que[3])
Détection et réduction des tonales musicales:
1 : à partir du signal débruité
2 : à partir du signal bruité
Les composantes spectrales au dessus juste de 2 sont candidates pour être du bruit
musical.

Ôë
Contribution
 Þ

Ô
 Þ
Evaluation objective

MBSD SSNR
(Modified Bark Spectral Distorsion) (Segmental Signal to Noise Ratio)

Ô
^ 
Evaluation subjective

è
  O
Wiener Loizou Lin Méthode
proposée
Input-5dB
-5dB

Input0dB
0dB

Input5dB
5dB

Input10dB
10dB

× 
 


 
 


 
  

  
  
 Ô^
- 
Conclusion et perspectives

‡ L¶apport de la psycho-acoustique est net.

‡ our la reconnaissance de la parole, on veut montrer que ce n¶est pas juste une
question de SNR.

 L'application de ces approches pour l'amélioration de l'intelligibilité audio et la


reconnaissance automatique de la parole pour des applications de téléphonie
mobile et de téléphonie main libre.

Ô-
  Bibliographie
[1] E Zwicker, R. Veldtkeller, sychoacoustique:L¶oreille, récepteur d¶information´, Masson, aris,
1981.
[2] Y. Hu and . Loizou, ³Incorporating a psychoacoustic model in frequency domain speech
enhancement´, | ?Y ?Y  , 11(2), 2004, pp. 270-273.
[3] A.Ben Aicha and S. Ben Jebara, ³Utilisation de la courbe de masquage pour la détection des
tonales musicales artificielles dans un signal de parole débruité par approche spectrales ´,
ISIVC200^, Tunisie.
[4] L. Lin,W. H. Holmes and E. Ambikairajah,³Speech denoising using perceptual modification of
Wiener filtering´, |  Y?  , vol. 38, no. 23, November 2002, pp. 148^-1487.
[5] T.Haulik, K.Linhard and .Schrogmeier, ³Residual noise suppression using psychoacoustic
criteria´, 
   

Merci pour votre attention


ÔG

You might also like