Professional Documents
Culture Documents
Département de : informatique
Spécialité : Intelligence Artificielle
=====================================================
Gueroui omar
2008/2009
LES MACHINES PARLANTES
SOMMAIRE
5. Applications……………………………………………………………………………..06
2
LES MACHINES PARLANTES
Nous nous intéressons dans le cadre de cet exposé à l’un des grands domaines applicatifs
d’ingénierie des langues : Les machines parlantes. Cet exposé fait le point sur les niveaux de
description de parle après l’historique des machines parlantes, puis nous présentons le
système de synthèse à partir du texte (machine capable a lire a partir de texte) et ces
domaines d’applications et on terminera avec le principe de système de dialogue homme
machine.
3
LES MACHINES PARLANTES
Parmi les automates les plus célèbres figurent « Le Joueur de Flûte », automate androïde
d’1m50 qui pouvait jouer une douzaine d’airs, et le « Canard », qui battait des ailes, mangeait
du grain et le rendait digéré (la digestion s’est avérée être une supercherie), présentés à Paris
en 1738. Il est probable que Vaucanson envisageait la construction d’un automate parleur [2].
L’abbé Mical construit en 1778 une « Téte d’airain » capable de prononcer une phrase, et
présenter à l’académie des sciences en 1783 une machine composée de deux téte parlantes,
qui séduit l’écrivain et journaliste Rivarol.
C’est le baron Wolfgang von Kempelen (1734-1804) qui a réalisé à Vienne en 1791 la
machine parlante la plus perfectionnée, après avoir construit un automate plus rudimentaire
dès 1778. Von Kempelen est connu pour son automate joueur d’échec qui fut présenté dans
divers pays et remporta des parties contre les grands de ce monde, mais qui s’avéra être une
supercherie (celle-ci fut dénoncée par Edgard Poe dans ses Histoiresgrotesques et
merveilleuses), un joueur humain de petite taille étant caché dans la machine.
Cette supercherie porta sans doute du tort à la crédibilité de sa machine parlante, qui était
pourtant une invention remarquable pour l’époque. Un soufflet faisait vibrer une anche qui
excitait un résonateur unique dont on faisait varier la forme pour les différentes voyelles avec
une main. Les consonnes, y compris les nasales étaient produites par quatre passages d’air que
l’on contrôlait avec les doigts de l’autre main [2].
4
LES MACHINES PARLANTES
Phonétique Phonologie
Étude des sons de la parole appelés phones Étude des sons à valeur linguistique,
phonèmes en relation avec un signifié. Les
traits phoniques sont appréhendés par rapport à
leur valeur distinctive.
5
LES MACHINES PARLANTES
Phonématique Prosodie
Étude linguistique des unités distinctives de Étude de la valeur linguistique des sons selon :
la langue, les phonèmes que l'on peut :
-leur durée (cs),
- commuter sur un axe paradigmatique : -leur intensité (dB),
ex. /ru/ (rue) / /nu/ (nu) - et leur variation mélodique (Hz).
(Le phonème a une fonction distintive)
- permuter sur un axe syntagmatique : A partir desquels les phénomènes
ex. /sale/ (salé) / /lase/ (lacé) d'accentuation et d'intonation sont constitués.
(Le phonème a alors une fonction
démarcative)
6
LES MACHINES PARLANTES
L’étude des significations des mots, de la façon dont elles sont liées les unes aux autres, et des
bases du choix lexical fait l’objet de la sémantique lexicale.
Parmi les principales questions qu’il lui appartient d’examiner, les problèmes d’ambiguïté de
portée prennent un part importante. Une phrase aussi simple que :
'Jean-François n’est pas parti à New York en avion'.
peut en effet être comprise comme :
Quelqu’un d’autre est parti à New York en avion
Jean-François est parti de New York en avion
Jean-François est parti ailleurs.
Jean-François est parti à New York par un autre moyen de transport
selon l’étendue du champ d’application de la négation, et ceci bien que toutes ces acceptions
admettent la même description syntaxique.
7
LES MACHINES PARLANTES
5. Applications : [3]
Les applications des systèmes de synthèse à partir du texte ne manquent pas. En voici
quelques exemples :
Services de télécommunications :
8
LES MACHINES PARLANTES
Une synthèse de très bonne qualité couplée à un logiciel d'apprentissage constitue un outil très
utile à l'apprentissage d'une nouvelle langue, en complément d'un cours avec un professeur. Si
ce type de produit n'a pas encore percé sur le marché, c'est à cause de la mauvaise qualité des
voix disponibles jusqu'à il y a peu. On voit par contre se multiplier les petits dictionnaires
électroniques de poche, qui devraient rapidement être dotés de voix de synthèse. Il en va de
même des traducteurs électroniques mot-à-mot qui sont apparus récemment. On pourra par
exemple bientôt lire un ouvrage dans une langue étrangère et utiliser un stylo à lecture optique
(intégrant un mini-scanner) pour obtenir instantanément la traduction d'un mot inconnu et sa
prononciation.
Les handicaps liés à la parole sont soit d'origine mentale, soit d'origine motrice ou sensorielle.
La machine peut être d'un grand secours dans le second cas. Avec l'aide d'un clavier
spécialement adapté et/ou d'un logiciel d'assemblage rapide de phrases, un handicapé peut
s'exprimer par la voix de son synthétiseur. Le célèbre astrophysicien Stephen Hawking donne
tous ses cours à l'université de Cambridge de cette façon. La synthèse offre également des
services aux personnes mal-voyantes, en leur donnant accès à l'information écrite "en noir"16,
à condition de coupler le synthétiseur à un logiciel de reconnaissance des caractères.
Le marché du jouet a déjà été touché par la synthèse vocale. De nombreux ordinateurs pour
enfants possèdent une sortie vocale qui en augmente l'attrait, particulièrement chez les jeunes
enfants (pour qui la voix est le seul moyen de communication avec la machine).
A plus long terme, le développement de synthétiseurs de haute qualité (ainsi que la mise au
point de reconnaisseurs fiables et robustes) permettra à l'homme de communiquer avec la
machine de manière plus naturelle. L'explosion récente du marché du multimédia prouve bien
l'intérêt du grand public en la matière.
Enfin, les synthétiseurs possèdent aux yeux des phonéticiens une qualité qui nous fait défaut :
ils peuvent répéter deux fois exactement la même chose. Ils sont par conséquent utiles pour la
validation de théories relatives à la production, à la perception, ou à la compréhension de la
parole.
9
LES MACHINES PARLANTES
Un module de prétraitement, qui joue principalement le rôle d’interface entre le texte
(représentation linéaire) et la structure de donnés internes gérée par le synthétiseur. Ce
module identifie toutes les séquences de caractères qui risquent de poser un problème
de prononciation : nombres, abréviations, acronymes, expressions toutes faites, etc. et
les transcrit éventuellement en toutes lettres.
Un analyseur morphologique, qui a pour tâche de proposer toutes les natures
possibles pour chaque mot pris individuellement, en fonction de sa graphie.
10
LES MACHINES PARLANTES
-un module de reconnaissance de parole dot le but est de transcrire le signal vocal donné en
entrée en un message orthographe. Il est composé de deux composants principaux, le modèle
acoustique et le modèle de langage.
-un module de compréhension de la parole dont le but est d’extraire les informations
pragmatiques (domaine d’application) rendant compte des actes de langage exprimés par
l’utilisateur .On peut distinguer deux grandes dans étapes dans les processus visant à
comprendre un énoncé : la compréhension hors contexte et la compréhension contextuelle.
Ce module doit composer avec les phénomènes spécifiques de l’oral déjà évoqués mais aussi
avec les erreurs de reconnaissance éventuelles.
11
LES MACHINES PARLANTES
Reconnaissance Compréhension
Dialogueur
Synthèse SQL
parole réponse
BDD
12
LES MACHINES PARLANTES
13
LES MACHINES PARLANTES
Les références :
[4] : www.linguistes.com\phonetique\phon.html.
[5] : www.irit.fr\diamant\Demos\prosodie.html.
[6] : www.irit.fr\diamant\Demos\tts_accueil.html.
[7]: Rosset.S : Stratégies et gestionaire de dialogue pour les systèmes d'iterrogation de base de
données é reconaissance vocale, nancy France, 2000.
14