You are on page 1of 18

LA SMANTIQUE DES TEXTES : CONCEPTS ET APPLICATIONS

Franois Rastier
C.N.R.S.

(Article publi dans Hermes, n16, 1996, pp.15-37)

SOMMAIRE

1. Problmatiques

1.1. La linguistique comme science des textes

1.2. Penser la diversit des textes


1.3. Les approches smantiques des textes
2. Tches et propositions d'une smantique des textes
2.1. Champ d'tude et principes de recherche de la smantique des textes
2.2. Les composantes
A. La thmatique
B. La dialectique
C. La dialogique
D. La tactique
E. Les formes smantiques
2.3. L'interaction entre composantes smantiques et les genres
3. Besoins et applications
3.1. Besoins et stratgies
3.2. Le traitement smantique assist
3.3. Genres textuels et traitements automatiques du langage
3.4. Incidences en retour sur la thorie linguistique
4. Le problme de l'interprtation et l'apport hermneutique de la smantique des
textes
4.1. Les ordres hermneutique et rfrentiel
4.2. Vers une hermneutique critique

--- page 15 ---

Cette tude prsente synthtiquement un point de vue argument par ailleurs dans diverses
publications [1]. Je commencerai par rappeler les principales approches, pour formuler
ensuite des propositions. Je mentionnerai ensuite les besoins nouveaux qu'une smantique
des textes doit contribuer satisfaire, puis les remaniements pistmologiques qu'elle
engage.

1. Problmatiques
1.1. La linguistique comme science des textes

Admettons tout dabord que les textes sont lobjet empirique de la linguistique. Isoler des
phrases, a fortiori des mots, rsulte dune dcision mthodologique ; de mme pour abstraire
des phrases et des significations, formes typiques dcrites par la linguistique.

Il ny a pas en droit deux linguistiques, lune qui serait centre sur la morphosyntaxe, et
lautre sur le texte : ce sont seulement deux paliers de description complmentaires.
Pour avoir nglig cela, la linguistique restreinte ne sest pas donn les moyens de penser
sa restriction. Quand par exemple Fauconnier estime que Elle a de bonnes jambes est une
phrase ambigu, parce quelle peut aussi rfrer une scne de cannibalisme, il souligne
involontairement

--- page 16 ---

combien de faux problmes peut susciter ltude de phrases sans attestation, sans contexte,
sans texte, sans situation.

De faon converse, la smiotique discursive a tent jadis de prendre son autonomie par
rapport la linguistique restreinte, pour se constituer en discipline autonome. Elle a connu
trs vite une involution spculative qui la trs vite coupe de la description linguistique et
des textes eux-mmes.

La lgitimit de lextension aux textes de la description linguistique reste conteste de


diverses faons, car la diversit et lhtrognit des textes ne laissent pas dinquiter.

On peut ragir soit par dngation : Molino souligne ainsi "lhtrognit des textes, pour
lesquels nous ne croyons pas [] quil existe de science unique", quil nomme plus loin
Science Magnifique des Textes (1989, p. 40). Or, la relation mdiate des textes divers
domaines dobjectivit et mme divers mondes nentrane pas que la linguistique devienne la
Science Universelle (cf. contra, Molino, p. 42.). Lhtrognt (comme diversit) de lobjet
est le lot de toute science descriptive, et une condition, plutt quun obstacle, son
existence. De lhtrognit des textes on ne peut conclure limpossibilit dune science
des textes, mais bien au contraire sa ncessit.

Une autre stratgie, accueillante celle-ci, est suggre par Van Dijk, quand il affirme :
"Ltude scientifique des textes ne peut tre que dordre interdisciplinaire" (1981, p. 90).
Lclectisme jouit certes de solides traditions universitaires, mais la notion de science
interdisciplinaire mriterait dtre examine. La confusion pistmologique qui a rgn en
smiotique, en IA, en sciences cognitives invite en effet la prudence. Par exemple ltude
du discours juridique nentrane aucunement quun mixte de linguistique et de droit se
constitue cet effet. Que les connaissances ncessaires linterprtation dun texte aient
t produites par dautres disciplines que la linguistique nempche aucunement la mise en
uvre dune smantique interprtative.

Nous estimons que la linguistique est la smiotique des langues et des textes, et comme
telle fait partie de la smiotique des cultures.

1.2. Penser la diversit des textes

Chaque texte procde dun genre, et chaque genre est relatif un discours (politique,
religieux, etc.). Les normes gnriques et discursives

--- page 17 ---

se surimposent au systme fonctionnel de la langue ; en dautres termes, on appelle langue


le rsultat dune description systmatique qui fait abstraction de ces normes. Elles nen ont
pas moins une incidence tous les niveaux : norme orale et norme crite diffrent
considrablement dans leur syntaxe, et mme parmi les genres crits, les rgles ou du
moins les usages syntaxiques varient (par exemple, les substantifs pithtes, communs
dans les genres journalistiques, sont rarissimes dans le roman).
Les dfinitions lexicographiques gardent trace du contexte, par les constructions et les
exemples, et du texte par les indicateurs de domaines (ex. cuis. pour cuisine) voire de genre
(pot. pour potique). Cette information indispensable pourrait tre encore systmatise.

Alors que la recherche a beaucoup progress aux paliers du mot et de la phrase, le


dveloppement dune linguistique du texte parat une entreprise prioritaire. La dimension
textuelle a t sous-estime en linguistique, ou dlgue des disciplines voisines.

Cependant son tude permet douvrir lespace des normes et le lien entre les textes et les
pratiques sociales o ils sont produits. Certes, la description linguistique des textes a connu
une brve priode dessor voici vingt ans, mais les recherches ont tourn court, faute sans
doute de thories linguistiques adquates et de possibilits institutionnelles et acadmiques.

1.3. Les approches smantiques des textes

On peut distinguer deux sortes principales de thories du texte : smiotiques et linguistiques.


Les thories smiotiques les plus connues considrent le niveau linguistique comme une
variable de surface (Greimas), et se sont nagure constitues par opposition des thories
linguistiques restreintes la morphosyntaxe. Avec lextension du champ des tudes
linguistiques, le principe dune smiotique discursive autonome devient de plus en plus
difficile dfendre. Pour leur part, les thories linguistiques se laissent ramener quatre
sortes.

a) Les thories issues de la smantique formelle, dont la plus connue est celle
de Kamp. Leur complexit technique est notable. En revanche, elles ne se
prtent pas une description comparative des textes. Par exemple, le
concept de genre na pu tre reformul dans ce cadre. Les descriptions, de
fait, ne stendent pas au-del du paragraphe.

--- page 18 ---

b) Les thories pragmatico-nonciatives issues de lanalyse du discours. Elles


se sont attaches identifier des marques de lnonciation, comme les
indexicaux, classer les actes de langage, tudier les structures
argumentatives des textes qui sy prtent. Ces thories se prtent lanalyse
des interactions microsociologiques, notamment ltude des conversations.
Elles sont lies certains genres oraux, mais ne se sont pas prtes la
typologie des textes, notamment parce quelle revendiquent une dfinition
transcendantale de la communication (cf. Grice et sa rfrence au kantisme,
Sperber et Wilson et leur postulation dun principe a priori de la pertinence
communicative).
Ces deux premiers types de thories sont compatibles entre elles, du moins
par le cousinage de la pragmatique et du positivisme logique au sein du
positivisme logique.

c) Les thories smantiques issues du courant saussurien (Coseriu, le


premier Greimas). Leurs domaines de prdilection sont la smantique
lexicale, la thorie des isotopies et lanalyse narrative. Dans ce cadre gnral,
le programme de la smantique unifie vise intgrer les trois paliers de
description linguistique (mot, phrase, texte) comme des paliers de complexit
diffrents, mais qui peuvent tre dcrits en utilisant les mmes concepts de
base (comme le sme).
Par leurs recherches sur linterprtation, ces smantiques se sont loignes
de lobjectivisme qui a marqu jadis le structuralisme, et se sont rapproches
de certaines thories hermneutiques, comme lhermneutique matrielle de
Szondi, qui est une forme labore mais reste lacunaire de lhermnetique
philosophique.

d) Les thories "rhtoriques" issues de ltude des langues de spcialit


(Swales, Bhatia). Lies pour la plupart la tradition anthropologique (Firth,
puis Halliday), elles sont soucieuses de dcrire la diversit des textes en
fonction des pratiques socialises, et ont accumul des observations
prcieuses dans des domaines comme le langage juridique.
On pourrait assister une convergence de ces trois derniers types de
recherche. Cela suppose dune part un refus commun de lobjectivisme et de
limmanentisme, et corrlativement le passage dune problmatique logico-
grammaticale, que la smantique a hrite du voisinage millnaire de la
grammaire et de la logique au sein du trivium, une problmatique
rhtorique-hermneutique. Peu importe quelle soit moins

--- page 19 ---

scientiste ou moins scientifique, comme on voudra : par sa prise en compte


de la complexit textuelle, elle a dj montr une capacit descriptive
suprieure, ce qui moyen-terme permettra de trancher pour des raisons
defficacit.

Un tat de lart reste faire, une synthse rechercher. Paralllement, il faut confronter,
valuer, conjoindre les diverses mthodes danalyse utilises pour dcrire les textes
scientifiques et techniques, et les textes littraires ou mythiques. Une typologie textuelle doit
tre difie avec des concepts issus de la smantique (puisque les structures textuelles sont
essentiellement smantiques). La description linguistique des genres scientifiques et
techniques na pas encore fait lobjet dun travail de recherche systmatique, du moins en
France, la diffrence par exemple du Danemark ou de la RFA (Fachtextlinguistik).[2]

2. Tches et propositions d'une smantique des textes


2.1. Champ d'tude et principes de recherche de la smantique des textes

Voici quelques orientations que nous assumons. Nous prenons pour objet dtude les textes
franais modernes, considrs en particulier dans leurs structures transphrastiques cela
impose la constitution de corpus dans le respect des pratiques et des situations, la typologie
des discours et des genres, et lanalyse smantique, car les structures transphrastiques sont
smantiques pour lessentiel.

Sans exclure au besoin les monographies, la perspective adopte est srielle. En


dautres termes, elle doit sappuyer sur des corpus importants, auxquels les moyens
informatiques donnent prsent un accs ais.

--- page 20 ---

Elle est prioritairement synchronique, mais nexclut pas des recherches


diachroniques ponctuelles (par exemple, sur lvolution thmatique dun genre).

Elle sappuie pour lessentiel sur des textes crits sans ngliger les discours
transcrits, comme par exemple les entretiens dexperts, ou les discours politiques.

Pour les textes crits, la situation des typologies est contraste. Distinguons grossirement
les textes pratiques et les textes mythiques. Les textes littraires sont fort tudis, mais par
la critique plutt que par la linguistique, et un gros travail reste faire pour unifier les
conceptualisations linguistiques de la stylistique, de la rhtorique et de lhermneutique.
Dautre part, la critique contemporaine a prt fort peu dattention la question des genres,
car elle doit sans doute la tradition romantique le got des uvres dexception. La
potique sefforait traditionnellement de classer les genres littraires ; mesure que le
concept de genre perdait de limportance pour les crateurs et les critiques eux-mmes,
lentreprise typologique passait au troisime plan.

Les textes scientifiques et techniques sont naturellement tudis dans une tout autre
perspective, pour lessentiel en terminologie, cest--dire un palier danalyse qui ne
dpasse pas le syntagme, et nest donc pas celui du texte. Mais ltude comparative de leurs
genres reste rare.

On sait que la mthode comparative issue de la linguistique historique na aucunement


dmrit. Trois entreprises typologiques simultanes sont concevoir selon ses principes :

(i) Celle des genres traite de la diversit externe des textes (cf. langues).

(ii) Celle des textes traite de la diversit interne des genres (cf. dialecte). Cette
typologie transcende les frontires linguistiques (ex. les motifs en
folkloristique).

(iii) Celle des morphologies traite de la parent des textes, indpendamment


des genres : il y a dans les textes un "vocabulaire" de formes smantiques,
dont certaines ont t reconnues et inventories par les traditions rhtoriques
et potiques, mais aussi dautres qui ne sont pas nommes, comme les
molcules smiques (structures stables de traits smantiques, qui non pas
ncessairement de lexicalisation privilgie).

En bref, les tches principales dune smantique des textes se disposent sur trois lignes
convergentes :

--- page 21 ---

(i) Elaboration dune smantique unifie pour les trois principaux paliers de
description (mot, phrase, et texte).

(ii) Elaboration de catgories pour un typologie des textes (littraires et


mythiques, scientifiques et techniques).

(iii) Dveloppement de ces thories descriptives en liaison avec les


traitements automatiques des textes.

Voici donc quelques propositions thoriques (dveloppes par ailleurs, 1989, 1994), qui
permettent de prciser ces objectifs.

2.2. Les composantes

Pour tablir le cadre conceptuel d'une typologie des textes, on peut concevoir la production
et l'interprtation des textes comme une interaction non-squentielle des composantes
autonomes : thmatique, dialectique, dialogique et tactique.
1 - La thmatique rend compte des contenus investis, cest--dire du secteur
de lunivers smantique mis en uvre dans le texte. Elle en dcrit les units.
Par analogie, et bien quelle ne dcrive pas spcifiquement le lexique, on peut
dire quelle traite du "vocabulaire" textuel, dont nous dtaillerons plus loin les
units (molcules smiques, faisceaux disotopies, etc.).

2 - La dialectique rend compte des intervalles temporels dans le temps repr-


sent, de la succession des tats entre ces intervalles, et du droulement
aspectuel des processus dans ces intervalles.

3 - La dialogique rend compte des modalits, notamment nonciatives et


valuatives, ainsi que des espaces modaux quelles dcrivent. Dans cette
mesure, elle traite de l'nonciation reprsente.

4 - La tactique rend compte de la disposition squentielle du signifi, et de


(l'ordre linaire ou non) selon lequel les units smantiques tous les paliers
sont produites et interprtes.

Chaque unit smantique, aux diffrents paliers danalyse, peut tre caractrise en fonction
de ces quatre composantes : en bref, situe par sa position dans lunivers smantique, par
un reprage identitaire, modal, temporel, ou distributionnnel.

Seule une dcision mthodologique peut isoler ces quatre composantes. Elles ne sont pas
indpendantes, mais en interaction. Dans la quasi-totalit des textes, chacune des
composantes est simultanment en interaction avec les autres. Aucune directionnalit n'est
impose ce dispositif htrarchique.

--- page 22 ---

La smantique du texte a notamment pour objectif de dcrire cette interaction. Elle doit le
faire en outre selon les quatre ordres de la description linguistique (paradigmatique,
syntagmatique, rfrentiel et hermneu-tique). En effet, chacun des types de reprage dune
unit smantique que permettent les quatre composantes est susceptible de quatre sortes
de description. On peut dcrire ainsi une forme smantique quelconque : par rapport un
rpertoire de formes, et lon en fait alors une description paradigmatique ; comme une part
dun enchanement de formes (description syntagmatique) ; comme le rsultat dun parcours
de constitution ou de reconstitution (description hermneutique) ; par rapport des formes
non linguistiques (description rfrentielle).
Chacune des composantes est par ailleurs susceptible de connatre les trois degrs de
systmaticit : systme fonctionnel, normes sociolectales, normes idiolectales.

A. La thmatique

a) La notion de thme a divers usages, en critique thmatique, en linguistique d'inspiration


pragoise (par opposition rhme), en analyse du discours (topic par opposition focus ). La
smantique descriptive peut clarifier cette notion en dfinissant le thme comme un
groupement structur de smes. Leur statut et leur nombre, les relations tablies entre eux,
tout cela varie selon les genres. Selon le statut de ces smes, il convient de distinguer les
thmes gnriques et les thmes spcifiques.

b) Un thme gnrique est dfini par un sme ou une structure de smes gnriques
rcurrents. Cette rcurrence dfinit une isotopie ou un faisceau d'isotopies gnriques (c'est-
-dire un groupement de smes gnriques co-rccurrents). Les isotopies gnriques, et
particulirement domaniales, dterminent le sujet ( topic ) du texte, ou plus prcisment
elles induisent les impressions rfrentielles dominantes. Par exemple, les textes techniques
tant contraints par un domaine d'application, ils ne manifestent qu'un domaine smantique,
alors que les textes littraires peuvent en juxtaposer plusieurs. Selon les types de classes
smantiques qu'ils manifestent, on peut distinguer quatre sortes.

(i) Les thmes taxmiques sont ports par les membres d'un mme taxme.

--- page 23 ---

(ii) Les thmes domaniaux sont ports par les membres d'un mme domaine
smantique. Les langues de spcialit dcrivent et structurent des domaines
smantiques.

(iii) Les thmes dimensionnels sont ports par les membres d'une mme dimension
smantique. Les dimensions valuatives ou thymiques, les tons, les espaces
modaux, les plans temporels ou chronotopes , dfinissent dans les textes autant de
sortes d'isotopies dimensionnelles.

(iv) Les thmes lis un champ smantique sont plus variables, puisque les champs
ne sont pas des classes de langue. Les plus faciles identifier sont ceux qui sont
codifis (topique littraire) ou dfinitoires d'un corpus.

c) Les thmes spcifiques sont des groupements rcurrents de smes spcifiques. Nous
avons propos de nommer molcules smiques ces groupements. Ils ne sont pas
ncessairement dpendants d'une lexicalisation particulire. En rgle gnrale, dans les
textes techniques, les molcules smiques ont cependant une lexicalisation privilgie, voire
exclusive, car les disciplines techniques rpugnent l'quivocit.

B. La dialectique

Comme elle traite des intervalles de temps reprsent et des volutions qui s'y droulent, la
dialectique rencontre les thories du rcit, qui ne participent pas de thories gnrales du
texte, mais dont les acquis doivent tre sauvegard. La dialectique est dfinie deux
niveaux, dont nous rappelons simplement les principaux concepts. Le premier niveau, dit
vnementiel, apparat dans tous les textes structurs par une composante dialectique. Ses
units de base sont les acteurs, les rles et les fonctions (au sens de Propp, soit un type
d'action reprsente).

1. Le niveau vnementiel

Un acteur peut tre dfini comme une classe d'actants : il est constitu par totalisation
d'actants anaphoriques des priodes (au palier infrieur du texte, msosmantique). Dans la
priode, les actants peuvent tre nomms ou recevoir diverses descriptions (dfinies ou
non). Chaque dnomination ou description lexicalise un ou plusieurs smes de l'acteur.
L'acteur se compose de trois sortes de structures smiques :

-- Sa molcule smique est constitue des smes spcifiques de ces actants.

--- page 24 ---

-- Outre leur molcule smique, les acteurs comportent par ailleurs des smes
gnriques, ici /humain/ ; mais dans certains genres les acteurs ne comprennent pas
ncessairement le trait /anim/ [3]. Les actants constituants d'un acteur peuvent
n'avoir pas de smes communs stables.

-- Enfin, un acteur comprend des smes affrents, qui sont des rles. Ce sont des
cas smantiques associs aux actants qu'il subsume. L'ensemble des rles d'un
acteur dfinit sa sphre interactionnelle. Elle volue avec les intervalles temporels.
On peut classer les acteurs selon le nombre et la nature des rles qui les
caractrisent.

b) Les fonctions sont des interactions typiques entre acteurs : ce sont des classes de
processus. Comme les acteurs, elles sont dfinies pas une molcule smique et des smes
gnriques : par exemple, le don est une fonction irnique (de transmission, valence
ternaire), le dfi une fonction polmique (d'affrontement, valence binaire). Les fonctions
correspondent des valences actorielles. Les fonctions peuvent se grouper en syntagmes
fonctionnels (ex : change se compose de deux transmissions, affrontement d'une attaque et
d'une contre-attaque). Les scripts sont des syntagmes fonctionnels typs par une isotopie
gnrique de champ ou de domaine.

L'ensemble du niveau vnementiel peut tre reprsent par des graphes


macrosmantiques. En bref, leurs noeuds reprsentent les acteurs et les fonctions, et leurs
liens reprsentent les rles.

2. Le niveau agonistique

Ce niveau est hirarchiquement suprieur au niveau vnementiel. Comme il n'apparat que


dans les textes mythiques, et que les applications concernent pour l'essentiel des textes
pratiques (notamment technologiques), sa prsentation sera succincte. Ses units de base
sont les agonistes et les squences .

a) Un agoniste est un type constitutif d'une classe d'acteurs. Dans les textes mythiques au
moins, il est frquent que les acteurs relevant d'un mme agoniste soient indexs sur des
isotopies gnriques diffrentes, voire dans des univers et des mondes divers, mais se
trouvent cependant en relation mtaphorique. Par exemple, dans Toine de Maupassant, la
Vieille est un acteur sur l'isotopie humaine, qui se trouve en relation

--- page 25 ---

mtaphorique avec le Coq sur l'isotopie animale, le Vent du large sur l'isotopie
mtorologique, et la Mort sur l'isotopie mtaphysique.
Les agonistes sont dfinis d'une part par les composants invariants ou quivalents des
molcules smiques de leurs acteurs, et aussi par les rles identiques ou quivalents dans
les sphres interactionnelles de ces acteurs. la diffrence des acteurs, ils ne comportent
pas ncessairement de smes gnriques qui les indexent sur des isotopies.

b) Les squences sont dfinies par homologation de syntagmes fonctionnels isomorphes.


Comme les syntagmes qu'elles homologuent occupent des positions diffrentes dans le
temps dialectique, les squences sont ordonnes par des relations de logique narrative
(prsuppositions) mais non chronologiques.

La distinction entre niveau vnementiel et niveau agonistique permet une typologie


dialectique et conduit dtailler la notion de rcit. En gnral, la composante dialectique des
textes pratiques ne comporte que le niveau vnementiel alors que les textes de fiction le
redoublent par un niveau agonistique.
C. La dialogique

La dialogique rend compte de la modalisation des units smantiques tous les paliers de
complexit du texte.

a) Un univers est l'ensemble des units textuelles associes un acteur ou un foyer


nonciatif : toute modalit est relative un site (un univers) et un repre (un acteur). Par
exemple, quand le narrateur de la Cousine Bette parle d'une mauvaise bonne action, `bonne'
renvoie l'univers de deux acteurs, et `mauvaise' son propre univers.

Chaque univers est susceptible de se diviser en trois mondes : (i) Le monde factuel est
compos des units comportant la modalit assertorique ; (ii) Le monde contrefactuel, des
units comportant les modalits de l'impossible ou de l'irrel ; (iii) Le monde du possible ,
des units comportant la modalit correspondante [4]. Mondes et univers peuvent voluer
selon les intervalles de temps dialectique.

--- page 26 ---

Dans le cadre ainsi esquiss, le rcit relve de la dialectique et la narration de la dialogique.


Ces deux composantes sont videmment lies. Par exemple, une fonction contrat consiste
en un change de processus de transmission situ dans les mondes du possible associs
aux acteurs contractants : en tant qu'change de promesses, il relve de la dialectique, mais
ces promesses elles-mmes, en tant qu'units modalises, relvent de la dialogique.

La dialogique fonde la typologie des nonciateurs reprsents. En gnral, les textes


d'instructions techniques ne comportent qu'un foyer nonciatif et un foyer interprtatif non
nomms, et se prsentent souvent comme une suite de phrases l'impratif. Les articles
scientifiques en revanche multiplient les nonciateurs dlgus par le biais de citations ou
d'allusions, et prcisent les foyers interprtatifs par de rituels clins d'oeil aux initis.

D. La tactique

Cette dernire composante rend compte de la disposition linaire des units smantiques
tous les paliers. La linarit du signifi entretient certes des rapports troits avec celle du
signifiant, elle ne se confond cependant avec elle aucun des paliers : rappelons les
morphmes signifiant zro, les ellipses, les units macrosmantiques comme les isotopies
ou les squences, dont les manifestations sont discontinues. En outre, des units
smantiques de toute dimension sont restitues par des infrences : elles appartiennent
alors au sens du texte, sans qu'on puisse pour autant leur assigner une position dans sa
linarit.

La position relative des units du signifiant peut tre videmment utilise comme indice des
relations distributionnelles entre units du signifi. Bref, quand le texte a une structure
dialectique, et quand le temps reprsent est linaire, les positions des units smantiques
ne s'ordonnent ncessairement ni selon la linarit du signifiant, ni selon celle du temps
reprsent.

E. Les formes smantiques

(i) Units textuelles et formes smantiques. -- Au palier textuel comme aux autres, les units
rsultent de segmentations et de catgorisations sur des formes et des fonds smantiques,
que l'on peut dsigner du nom gnral de morphologies. Leur tude se divise en trois
sections : liens entre fonds (dans le cas par exemple des genres qui
--- page 26 ---

comportent plusieurs isotopies gnriques), liens entre formes (dont il faut faire une
description diffrentielle), et surtout liens des formes aux fonds (cruciaux pour l'tude de la
perception smantique).

Selon les composantes, ces morphologies smantiques peuvent faire l'objet de diverses
descriptions. Par exemple, rapport aux quatre composantes, un groupement stable de traits
smantiques (ou molcule smique) peut tre dcrit comme thme, comme acteur, comme
but ou source d'un point de vue modal, comme place dans la linarit du texte. En outre,
chaque composante correspondent des types d'oprations productives et interprtatives.

(ii) Description dynamique .-- Traditionnellement, la linguistique textuelle a tendu au texte


les procdures de segmentation issues de la morphosyntaxe. Cependant, il ne s'agit pas
d'interprter des units qui se donneraient comme discrtes ou dj discrtises, mais de les
discrtiser comme des moments de parcours interprtatifs. Si la description statique peut
convenir certaines applications, en didactique par exemple, une description plus fine doit
restituer l'aspect dynamique de la production et de l'interprtation des textes. La premire
tape consiste dcrire les dynamiques de ces fonds et de ces formes : par exemple, la
construction des molcules smiques, leur volution, et leur dissolution ventuelle.

Ces dynamiques et leurs optimisations sont paramtres diffremment selon les genres et
les discours. D'une part les formes et les fonds sont constitus et reconnus par rapport des
prsomptions, et compars des strotypes diffrents selon les pratiques. En outre, les
contrats de production et d'interprtation qui sont associs aux genres et aux discours
norment le parcours de ces morphologies. Pour en tenir compte, la smantique des textes
doit adapter ses descriptions aux rgimes morphologiques des discours et des genres.

Enfin, la perception des formes et celle des fonds posent des problmes diffrents : celle des
fonds semble lie des rythmes, celle des formes des contours (dont les contours
prosodiques peuvent prsenter une image).

--- page 28 ---

2.3. L'interaction entre composantes smantiques et les genres

Nous venons de dfinir des units et des relations dans les quatre composantes : elles
restent analysables en smes. Nous avons procd dans une perspective de production ou
d'interprtation, qui en reste la smantique : les objets dcrits sont tous constitus d'units
et de relations smantiques organisant des fonds ou des formes.

Chacune des composantes peut tre la source de critres typologiques. On peut classer les
textes selon les critres les plus divers, nombre et nature des isotopies gnriques,
reprsentation de l'nonciation, etc. Aussi proposons-nous cette hypothse : sur le plan
smantique, les genres sont dfinis par des interactions normes entre les composantes que
nous venons de dcrire.

a) La thmatique d'un texte peut d'abord se dcrire par son tendue, c'est--dire la part de
l'univers smantique mise en jeu, comme par ses restrictions de fait. Rapporte la tactique,
cette tendue est linarise en isotopies ou spcifie en molcules smiques, les unes
comme les autres pouvant tre caractrises par leur position relative dans le texte.
L'tendue thmatique peut varier au cours du texte.
Rapportes la dialectique, les molcules smiques deviennent, par adjonction de traits
casuels affrents, des acteurs ou des fonctions, voire -- aprs homologation -- des agonistes
ou des squences. Rapportes la dialogique, les isotopies et molcules smiques se
placent dans des espaces modaux. Pour les textes narratifs, cela ouvre la possibilit de
dcrire des sphres possibles ou irrelles du rcit. Mais encore, pour les textes descriptifs,
cela permet de rendre compte des points de vue et des valuations qui en sont
insparables.

b) La dialectique d'un texte peut tre spcifie par le type de processus qu'elle met en
oeuvre, notamment selon qu'ils sont rversibles ou non. Parmi les processus irrversibles,
certains constituent des molcules smiques nouvelles. L'volution interne de l'univers
smantique dpend ainsi des structures dialectiques du texte.

Les textes pratiques, du moins ceux qui dcrivent des procdures, n'utilisent pas l'ellipse des
fonctions, puisqu'ils ont des objectifs didactiques. En revanche, les textes mythiques utilisent
ces ellipses, dans la mesure o ils renforcent l'appartenance une culture en prsupposant
la connaissance de ses rgles. La succession strotype des fonctions

--- page 29 ---

dans les syntagmes fonctionnels sert ici d'interprtant et permet de suppler les fonctions
attendues mais manquantes. Sans en tre dfinitoire, la structure dialectique peut tre
spcifique d'un genre.

c) La dialogique a t bien tudie pour les textes littraires, mais peu pour les autres.
Rapportes la thmatique et la dialectique, les variations dialogiques introduisent des
dnivellations entre mondes et des ramifications du temps.

d) Rapporte aux autres composantes, la composante tactique permet de dfinir des


rythmes smantiques, dfinis par la mise en rapport d'une unit ou d'une classe d'units, et
d'une srie de positions dans la syntagmatique du signifi. On peut distinguer ainsi des
rythmes thmatiques (utiliss notamment en posie), des rythmes dialectiques (mis profit
dans les arts du rcit), des rythmes dialogiques (dans les romans polyphoniques, et le
thtre notamment). Au del de leur utilisation esthtique, ces rythmes jouent
vraisemblablement un rle dans la comprhension, en favorisant d'une part la mmorisation,
et d'autre part la reconnaissance des formes smantiques.

3. Besoins et applications

3.1. Besoins et stratgies

a) Besoins sociaux

On sait que l'informatique donne prsent accs d'normes masses de textes,


accessibles sur des supports de moins en moins cuteux. Paralllement se cre le besoin,
entre les applications classiques d'intelligence artificielle et d'automatique documentaire, de
crer des instruments de recherche et d'exploration assistes dans les textes.

--- page 30 ---

Les besoins des milieux professionnels vont croissant, notamment dans les domaines de
l'extraction d'expertise et de l'analyse du contenu. Par exemple, telle compagnie d'assurance
cherche des linguistes pour analyser les structures narratives dans 9.000 dclarations
d'accidents mortels ; tel service dpendant du Ministre de la Dfense veut analyser 120.000
pages de documents historiques sur les Balkans pour faire de la prospective partir de
squences vnementielles. Dans le domaine du marketing enfin, on cherche dpasser les
mthodes lexicomtriques par analyse factorielle, aussi prouves que limites.

b) Stratgies

De plus en plus, devant la masse croissante des donnes disponibles, on recherche des
moyens informatiques pour liminer les donnes non pertinentes pour l'application. Deux
stratgies sont exploitables. La premire, issue de la tradition documentaire, mdiatise le
rapport aux textes par un thesaurus, et/ou une indexation. Elle a fait ses preuves, mais
conserve un aspect normatif. En outre, il est difficile de faire voluer des thesaurus et des
indexations. Or, exploiter les bases textuelles exige sans doute de pouvoir modifier les
corrlats en fonction des besoins de la recherche, au lieu de proposer toujours les mmes.

La seconde stratgie se dveloppe avec l'accs informatique au plein texte. Elle permet de
caractriser un texte en fonction d'une requte ponctuelle (par analyse de la question) ou
permanente (profil de l'utilisateur) ; ou encore de l'indexer contrastivement par rapport aux
autres textes du corpus ou d'un sous-corpus de travail.

D'une part l'volution et la normalisation des formats de saisie permet d'amliorer le balisage
des units de l'expression textuelle (ex. norme SGML) ; la description des standards
smantiques peut s'appuyer sur cette normalisation, et la complter.

D'autre part, l'informatisation des dictionnaires va permettre brve chance des


tiquetages smantiques rudimentaires (indicateurs de domaines, par exemple).
L'tiquetage par traits gnriques, voire ultrieurement par traits spcifiques, ouvre une
direction de recherche prometteuse.

3.2. Le traitement smantique assist

Dans ce type d'application, l'interaction avec l'informatique se situe sur le plan


mthodologique que sur le plan thorique : il ne s'agit

--- page 31 ---

pas de construire des maquettes qui fonctionnent sur quelques phrases-test, mais d'utiliser
les logiciels existants, en combinant diffrents outils (analyseurs morphologiques,
statistiques, etc.) pour l'aide au traitement smantique de gros corpus textuels. Par exemple,
il importe de mettre au point un systme d'aide l'analyse smantique qui dpasse les
mthodes fondes sur les co-occurrences de mots cl, et qui permette de slectionner les
sous-corpus pertinents en fonction des tches accomplir (cf. e.g. l'auteur, 1995).

Pour cela on dispose de deux sortes d'outils : les analyseurs, qui sont mieux dits tiqueteurs
(taggers ) et les navigateurs.

(i) Les tiqueteurs se divisent en deux classes : les analyseurs morphosyntaxiques et les
dictionnaires informatiss. Ils permettent d'enrichir le texte d'indexations morphologiques,
syntaxiques, smantiques, qui attachent des mots ou expressions la mention de leur
catgorie dans l'occurrence rencontre. Ces tiqueteurs marquent pour l'essentiel l'incidence
du syntagme et de la phrase sur le mot. Par ailleurs, les indexations statistiques ou certaines
indexations smantiques marquent l'incidence du texte sur le mot.
(ii) Les navigateurs sont des systmes d'interface qui tablissent des liens entre parties d'un
texte, textes divers, voire manifestations smiotiques diverses. Les plus connus sont de type
hypertexte. Ils donnent accs des donnes, mais ne les produisent ni ne les traitent. Il
importe donc de les utiliser en leur donnant un contenu appropri aux applications.

Les systmes d'analyse smantique assiste doivent rpondre des besoins trop divers
pour pouvoir tre dvelopps hors d'une application. Soit par exemple une application de
Diffusion cible [5]: en fonction du profil de chaque utilisateur, tabli par son rsum
d'activit, les textes numriss lui sont achemins par courrier lectronique. L'objectif est
d'amliorer l'application en dpassant les calculs de proximit entre documents, et en tenant
compte pour cela de la structure des textes diffuss.

--- page 32 ---

3.3. Genres textuels et traitements automatiques du langage

Comme les Traitements automatiques du langage (TAL) ont affaire des textes, non des
phrases, Leur typologie est une condition de leur analyse.

Les besoins en amont sont le recueil du corpus et sa pranalyse. D'une part, il faut vrifier
l'homognt du corpus d'tude, quel que soit le traitement envisag, et en premier lieu le
traitement statistique. Si le corpus n'est pas homogne, il faut poser le problme de la
caractrisation interne du corpus par la cration de sous-classes. Les critres de cette sous-
classification dpendront de l'objectif.

Dans un corpus homogne, on peut poser la question de la structure du genre. En premier


lieu, on peut tudier la structure syntagmatique. Certaines parties des textes peuvent en effet
tre systmatiquement limines, pour constituer des sous-corpus pertinents.

Pour la caractrisation assiste, on peut envisager trois stratgies :

-- L'indexation contrastive de tous les textes d'un corpus sans pranalyse smantique, au
moyen de logiciels (comme le THIEF de Brunet), qui permet de mettre en vidence des pics
et dpressions statistiques.

-- La caractrisation des squences (paragraphes, par exemple) pertinentes pour une


application, et des critres de leur mise en vidence (position, indices).

-- La cration de sous-corpus smantiquement enrichis pour rpondre aux objectifs de la


tche en cours.

Pour parvenir des traitements automatiques spcifiques et efficaces de gros corpus, il


convient de spcifier les fonctionnements propres aux diffrents genres textuels, pour
adapter les stratgies d'interrogation ces genres. Le paramtrage pralable des types
textuels permet enfin de simplifier les traitements automatiques, par exemple en liminant
les ambiguts. Ainsi, dans les compte rendus d'hospitalisation, pense ne correspond qu' la
troisime personne ; il en irait autrement dans un corpus de lettres aux collgues.

3.4. Incidences en retour sur la thorie linguistique

Ce type d'tude permet de refonder ou d'affiner la distinction intuitive et empirique en genres,


et de rpondre des questions comme : Le roman par lettres est-il bien un roman ? Faut-il
classer ensemble romans et nouvelles ?
--- page 33 ---

Les variations morphosyntaxiques selon les genres sont notables. Par exemple, les textes
littraires contiennent trois fois moins de passifs que les autres ; la position de l'adjectif, la
nature des dterminants, des pronoms et des temps, l'usage du nombre varient aussi
notablement. La typologie textuelle peut ainsi apporter du nouveau en linguistique thorique,
notamment en morphosyntaxe.

En lexicologie, sur les valeurs positionnelles des units lexicales, et leur rpartition varie
galement selon les genres : par exemple une tude contrastive de Biber (1993 a) a permis
de mettre en vidence un liste de 6.000 mots, pour la plupart concrets, propres aux textes
fictionnels (cf. impatiently ou sofa).

Bref, l'tude des normes linguistiques complte utilement celle des rgles, et permettra sans
doute de prciser leurs conditions d'application.

Les besoins satisfaire ne sont pas seulement techniques. Pour dfinir le cahier des
charges d'une station de travail, il faut prvoir les stratgies d'interrogation. Et pour cela, il
faut une vue claire des structures smantiques des textes et de leurs processus de
comprhension. Cela exige un approfondissement thorique pluridisciplinaire en linguistique,
en psychologie et en informatique.

Aucune de ces deux stratgies n'chappe ces contradictions : (i) on manipule des mots
pour tudier des textes ; (ii) on manipule des chanes de caractres pour tudier des
signifis.

4. Le problme de l'interprtation et l'apport hermneutique de la smantique


des textes

Alors qu'au cours de ce sicle, la linguistique a acclr son involution positiviste et accru
corrlativement son dficit hermneutique, le moment est venu de formuler des propositions
qui tiennent compte du caractre hermneutique des sciences du langage.

L'hermneutique matrielle runifie l'hermneutique et la philologie, et place donc la


problmatique de l'interprtation au coeur des sciences du langage. Cela conduit privilgier
le palier du texte, et reformuler dans ce cadre le rapport entre global et local. Enfin
reformuler le lien entre les textes et leur entour social et historique, ce qui suppose une
thorie des genres et des pratiques sociales qui les dfinissent.

--- page 34 ---

4.1. Les ordres hermneutique et rfrentiel

Cet objectif gnral nous a incit proposer une reformulation des ordres de la description
linguistique.

Outre l' ordre syntagmatique (celui de la linarisation du langage, dans une tendue spatiale
et/ou temporelle), et l'ordre paradigmatique ; (celui de l'association codifie), les langues
mettent en oeuvre deux autres ordres, qui la diffrence des deux premiers, ne sont pas
rgis principalement par leur systme fonctionnel.

(i) L' ordre hermneutique est celui des conditions de production et d'interprtation des
textes. Il englobe les phnomnes de communication, mais il faut souligner que les textes ne
sont pas simplement des messages qu'il suffirait d'encoder puis de dcoder pour en avoir fini
avec la langue. Il englobe aussi ce que l'on appelle ordinairement les facteurs pragmatiques,
qui affectent la situation de communication hic et nunc ; mais il les dpasse car il inclut les
situations de communication codifies, diffres, et non ncessairement interpersonnelles. Il
est insparable de la situation historique et culturelle de la production et de l'interprtation.

(ii) L' ordre rfrentiel ;engage traditionnellement les rapports entre d'une part les signes, les
concepts et les choses, d'autre part les phrases, les propositions et les tats de choses .
Ce rapport n'a rien d'immdiat : il s'tablit par la mdiation d'impressions rfrentielles,
sortes d'images mentales que nous avons dfinies comme des simulacres multimodaux (cf.
1991a).

Ce que nous appelons ici rfrence n'est pas un rapport de reprsentation des choses ou
a des tats de choses, mais un rapport entre le texte et la part non linguistique de la pratique
o il est produit et interprt. L o l'ordre hermneutique marque l'incidence de la pratique
sur le texte, l'ordre rfrentiel fait retour du texte la pratique, et traite l'incidence inverse du
linguistique (et plus gnralement du smiotique) sur les strates non smiotiques de la
pratique. La rfrence ainsi dfinie ne relve pas de la reprsentation mais de l'action, telle
qu'elle est structure par une pratique. Plus gnralement, l'ordre rfrentiel met en jeu, de
faon diffrencie, au sein de chaque pratique sociale, les rapports variables entre la sphre
smiotique (ici les suites linguistiques), la sphre des reprsentations (ici les impressions
rfrentielles), et la sphre physique (ici les objets ). Il faut donc prciser les modes de
rfrenciation propres aux pratiques sociales.

--- page 35 ---

Pour y contribuer, nous avons formul quelques propositions concernant les textes littraires
(cf. 1989, II).

4.2. Vers une hermneutique critique

Une smantique des textes, quel que soit son statut au sein de la linguistique, se voit
affronte deux ordres de problmes qui dfinissent son objet et ses objectifs : d'une part,
lier la "lettre" du texte, entendue au sens philologique et grammatical, avec son "esprit",
c'est--dire les diverses interprtations qu'il contraint et suscite. Cela conduit rompre avec
deux attitudes unilatrales, que nous nommerons le "littralisme" et le "spiritualisme".

Le "littralisme" aujourd'hui une linguistique restreinte, domine par le positivisme et le


formalisme, qui se conjoignent dans le positivisme logique et la philosophie du langage
anglo-saxonne. Elle peut suivre deux voies. La voie formaliste, asmantique, rduit le signe
son seul signifiant : elle ne considre que la forme des "symboles", et dcalque leur sens
de leur composition syntaxique. La voie substantialiste rapporte le mot son sens littral,
cens s'imposer d'vidence, alors qu'il est le rsultat d'une construction interprtative et mais
que personne n'a su proposer de mthode pour le produire. Comme les usages effectifs font
peu de cas du sens littral, on a cr la notion de sens driv : pour en pallier les
insuffisances, il se distingue certes du sens littral, mais il ne fait que confirmer sa
prcellence.

Le "spiritualisme" son tour emprunte deux voies. D'une part le mentalisme classique
aujourd'hui revivifi par la smantique cognitive, qui dlie le sens des langues et des textes
pour le fonder dans un espace transcendantal (Langacker) ou dans une phnomnologie
exprientielle (Johnson).
La seconde voie est celle d'une hermneutique regrettablement coupe de son substrat
textuel, et ontologise par la phnomnologie heideggerienne. Elle a abouti au
dconstructionnisme.

Or il existe une place entre une philologie positiviste et une philosophie spculative : celle
d'une linguistique ouverte sur les textes et consciente de son statut hermneutique. Elle
entend contester, rduire, voire annuler, la sparation de la lettre et de l'esprit, gage sur
l'allgorisme paulinien, qui prolonge lui-mme le dualisme platonicien. Entre la forme
matrielle du texte et ses interprtations, tout un systme

--- page 36 ---

de normes, dont tmoignent les structures textuelles, assure la mdiation indispensable.


Mieux, l'identification mme des moindres signes n'chappe pas aux conditions
hermneutiques ; et la reconnaissance des contraintes linguistiques leur tour peut seule
librer l'hermneutique de son involution spculative.

BIBLIOGRAPHIE

Adam, J.-M. (1990) Elments de linguistique textuelle, Bruxelles, Mardaga.

Barthes, R. (1972) Article Texte, Encyclopaedia universalis, t. 15.

Beaugrande, R. A. de, et Dressler, W. (1984) Introduzione alla linguistica testuale , Bologne,


Il mulino.

Bellert, I. (1971) On a condition of coherence of texts, Semiotica, III, 4, pp. 253-288.

Bhatia, V. K. (1993) Analysing Genre : Language Use in Professionnal Settings, Londres,


Longman.

Berkenkotter, C. & Huckin, T. N. (d.) (1995) Genre Knowledge in Disciplinary


Communication, Hillsdale (N. J.) Lawrence Erlbaum.

Biber, D. (1988) Variations across Speech and Writing, Cambridge, CUP.

------(1992) The multi-dimensional approach to linguistic analysis of genre variation : an


overview of methodology and findings, Computers and the Humanities, 26 (5-6) 331-345.

------(1993 a) Using Register-Diversified Corpora for General Language Studies, CL 19


(2)219-241.

------(1993 b) Co-occurrence Patterns among Collocations : A Tool for Corpus-Based Lexical


Knowledge Acquisition", CL 19 (3) 531-538.

Brown, G., Yule, G. (1983) Discourse Analysis , Cambridge, Cambridge University Press.

Coseriu, E. (1981) Textlinguistik -- Eine Einfhrung , Tbingen, Narr.


Culioli, A. (1984) Sur quelques contradictions en linguistique, Communications, 20.

Eco, U. (1979) Lector in fabula , Milan, Bompiani.

Harris, Z., 1969, Analyse du discours, Langages , 61, pp. 8-45.

Jucquois, G. (1986) Aspects anthropologiques de quelques notions philologiques, in


Franois, F. (d.) Le texte parle , Louvain, CILL, pp. 183-248.

Kempson, R. (1982) La Semantica , Bologne, Il Mulino.

Lallot, J., d. (1989) La grammaire de Denys le Thrace, Paris, ditions du CNRS.

Lardet, P. (1992) Travail du texte et savoirs des langues, in Auroux, S. (d.) Histoire des
ides linguistiques, Bruxelles, Mardaga, t. II, pp. 187-205.

Leach, E. (1980) L'unit de l'homme et autres essais, Paris, Gallimard.

------ ( paratre) Hermneutique matrielle et smantique des textes, in Salanskis, J.-M. et


al. (ds) Hermneutique : textes, sciences.

Rastier, F. (1987) Smantique interprtative , Paris, PUF.

------ (1989) Sens et textualit , Paris, Hachette.

------ (1991) Smantique et recherches cognitives, Paris, PUF.

_____ (1994) Sur l'immanentisme en smantique, Cahiers de Linguistique Franaise , 15,


pp. 325-335.

------ d. (1995) L'analyse thmatique des donnes textuelles -- L'exemple des sentiments ,
Paris, Didier.

------ ( paratre) Hermneutique matrielle et smantique des textes, in Salanskis, J.-M. et


al. (ds) Hermneutique : textes, sciences.

Rastier, F. et al. (1994) Smantique pour l'analyse, avec la collaboration de Marc Cavazza et
Anne Abeill, Paris, Masson.

Ricoeur, P. (1986) Du texte l'action. Essais d'hermneutique II , Paris, Seuil.

Rorty, R. (1985) Texts and Lumps, New Literary History , XVII, 1.

Rutten, F. (1980) Sur les notions de texte et de lecture dans une thorie de la rception,
Revue des sciences humaines , 177.

Slakta, D. (1985) Grammaire de texte : synonymie et paraphrase, in Fuchs, C., (d.) Aspects
de l'ambigut et de la paraphrase dans les langues naturelles , Berne, Peter Lang.

Stati, S. (1990) Le transphrastique , Paris, PUF.

Swales, J. M. (1990) Genre Analysis. -- English in Academic and Research Settings ,


Cambridge, Cambridge University Press.
Van Dijk, T. (1984) Texte, in Beaumarchais, d. Dictionnaire des littratures de langue
franaise , Paris, Bordas.

Weinrich, H. (1989 [1982]) Grammaire textuelle du franais, Paris, Didier.

NOTES

[1] Malgr son caractre personnel, il doit beaucoup aux dbats conduits avec divers collgues et
amis, notamment au sein de l'quipe Smantique des textes de l'Universit Paris-Sorbonne.

[2] En France; les chercheurs manquent encore d'un corpus de rfrence numris et suffisamment
diversifi. Certes, la base Frantext de l'Institut National de la Langue Franaise a l'avantage de
recueillir aussi bien des textes littraires que des textes techniques et scientifiques (en nombre
insuffisant mais croissant). Elle est la seule, dans le domaine franais, permettre un accs conjoint
ces textes, de manire les contraster. Mais ce corpus n'a pas t exploit systmatiquement dans
sa varit gntique (ce qui ne recoupe pas les tudes lexicographiques en cours). Par exemple; les
romans et les recueils de nouvelles sont indexs ensemble ; une classification nouvelle ne serait-elle
pas ncessaire? Dans une tude thmatique sur les sentiments (1995), nous avons pu ainsi tablir
que les sentiments du roman diffrent de ceux de l'essai.

[3] Le concept d'acteur ainsi dfini n'a pas de rapport avec privilgi avec la notion de personnage.
Les personnages d'une pope sont par exemple des acteurs, mais au mme titre que les pices et
les outils d'une notice de montage.

[4] Nous ne prtendons pas pour autant que la thorie logique des mondes possibles puisse
s'appliquer la smantique des textes. Le monde du possible n'est pas un monde possible au sens
de Leibniz - qui dans sa Thodice ne voyait aucun obstacle ce que les romans de mademoiselle de
Scudry se ralisent un jour.

[5] A laquelle nous collaborons avec Xavier Lemesle et Bndicte Bommier (Direction des Etudes et
Recherches d'Electricit de France).

Texto! 1996 pour l'dition lectronique

You might also like