You are on page 1of 38

MME Danielle Leeman

Distributionnalisme et structuralisme
In: Langages, 8e année, n°29, 1973. pp. 6-42.

Citer ce document / Cite this document :

Leeman Danielle. Distributionnalisme et structuralisme. In: Langages, 8e année, n°29, 1973. pp. 6-42.

doi : 10.3406/lgge.1973.2219

http://www.persee.fr/web/revues/home/prescript/article/lgge_0458-726X_1973_num_8_29_2219
D. LEEMAN
Paris-X, Nanterre

DISTRIBUTIONNALISME ET STRUCTURALISME

L'on assimile généralement les procédures de Harris — tout en lui


reconnaissant une rigueur exceptionnelle — à la théorie structuraliste. Et
simultanément, dans le but pédagogique ou polémique de présenter le
structuralisme comme un phénomène homogène, on mêle les vues et les
méthodes de linguistes différents, Harris y compris, à partir de similitudes
apparentes qu'il aurait fallu replacer dans leur contexte.
Ainsi Lyons opère, dans son Introduction à la Linguistique générale
(trad. Larousse 1970) une présentation de la linguistique structurale en
partant de Ferdinand de Saussure (p. 32) et en passant par les notions
de « primauté de la langue parlée » (p. 32), de « primauté de la description
synchronique » (p. 37), de « langue et parole » (p. 41), de « double articula
tion du langage » (p. 44), de « substance et forme » (p. 45), d'où il tire les
notions de « caractère discret des éléments d'expression » (p. 54), et de
« distribution » (p. 56). Or, chez Harris, et d'ailleurs plus généralement
dans la linguistique américaine qui n'avait pas à se dégager des méthodes
diachroniques, la description synchronique va de soi, et il n'est explicit
ement pas question des distinctions entre substance et forme, entre langue
et parole ou de double articulation. En dehors du fait que cette présentation
serait acceptable du point de vue pédagogique si son schématisme ne
menait à des incompatibilités — on voit mal par exemple comment un
pédagogue, s'inspirant de Lyons, pourra concilier opposition fonctionnelle
et distribution sinon en faussant l'une et l'autre théories, elle n'en n'est pas
moins critiquable d'un point de vue scientifique, dans la mesure où cet
amalgame aboutit à des conclusions complètement erronées. C'est ainsi
qu'on peut lire page 58 :
Comme nous l'avons vu, deux éléments d'expression sont en
opposition si l'on obtient un mot différent ou une phrase différente
en remplaçant l'un par l'autre dans le même contexte; si on n'obtient
f>as ce résultat, ils sont en variation libre. Mais on peut envisager
es mots, ainsi que les autres unités grammaticales, dans deux pers
pectives différentes. Ce n'est que par rapport à la fonction grammat
icale des mots — en gros, noms, verbes, adjectifs, etc. — que les
notions d'opposition et de variation libre peuvent se traduire par
des équivalences distributionnelles; et ceci parce qu'il y a un rapport
direct entre la fonction grammaticale et la distribution.

Dans la mesure où Lyons se situe explicitement dans une perspective dis-


tributionnelle, cette dernière phrase est fausse puisque la relation est en fait
inverse : les catégories, aussi bien grammaticales que sémantiques, sont
dérivées des caractéristiques distributionnelles.
Il a donc paru utile, en dehors de la nécessité première de situer le pro
blème de la paraphrase lui-même dans l'œuvre de Harris, de présenter ses
postulats, ses concepts, ses procédures, qui ne sont aucunement semblables
à ceux des « Européens » ni même à ceux de Bloomfield.

I. Postulats, définitions et méthodes.

1-1. La définition préalable des concepts linguistiques n'est pas


la même.
1. 1.1. La définition de l'objet.
Harris ne se pose pas explicitement le problème de la définition de
l'objet de la linguistique par rapport à tout ce qui ne serait pas exclusiv
ement du domaine de cette linguistique, comme le fait Saussure 1 par
exemple qui cherche à différencier la linguistique de l'ethnologie, de la
sociologie, de la psychologie (CLG, p. 21) et essaie de lui attribuer un objet
propre (CLG, p. 25 et suivantes) ou comme le fait A. Martinet dans les
premières pages de ses Éléments de Linguistique générale. Harris spécifie
simplement qu'il ne s'agit pas de décrire le comportement verbal humain
dans son ensemble, mais des régularités de traits de parole constituant le
stock d'énoncés, ou corpus, sur lesquels on fonde l'analyse. Les linguistes
européens se donnent pour objet la langue, définie comme un système
mental n'ayant de réalité que par la communication. Ce que l'on doit découv
rir est spécifié avant même le début de la recherche.
L'objet tel qu'il est défini par les uns et par l'autre va conditionner
deux types de méthodes radicalement différents. Le fait de voir dans la
langue un phénomène mental présuppose en effet une certaine conception
du rapport langue /pensée ou pensée /langue; ce rapport est, en l'occurrence,
plus ou moins explicitement défini par le fait que la pensée précède la
langue. A. Martinet écrit par exemple dans LLS page 4 :

Le langage sert à ordonner ou clarifier notre pensée, ou à s'expri


mer,
ou à communiquer.

Le fait de dire qu'un élément est linguistique s'il dépend du choix du


locuteur va dans ce sens et implique un processus de type : 1. Pensée;
2. ensemble de mots; 3. choix; 4. parole.
Certaines réflexions de Jakobson laissent supposer le même type
de postulat; il écrit par exemple (Essais, p. 94) :

En gros, le processus d'encodage va du sens au son, et du niveau


lexico-grammatical au niveau phonologique (...)
Du point de vue de la méthode linguistique, cela entraîne un certain nombre
de conséquences; sans aller jusqu'à décrire les phénomènes linguistiques en
fonction de processus mentaux comme le fait Saussure (cf. par exemple
CLG, p. 178) :
(...) il existe dans le subconscient une ou plusieurs séries associa
tivescomprenant des unités qui ont un élément commun avec le
syntagme, par exemple :

1. On se sert ici uniquement, et donc peut-être à tort, du Cours de Linguistique


générale.
dé — faire —
décoller faire
déplacer refaire
découdre contrefaire
etc. etc.

les éléments linguistiques sont supposés immédiatement connus et ne


sont donc pas véritablement découverts par l'analyse linguistique (cf. 1.2).
La deuxième différence avec Harris, c'est l'insistance dans la défini
tionde l'objet sur le fait qu'il est social, qu'il n'existe que par la communic
ation 2; ainsi pour Jakobson (Essais, p. 27) :

(...) le langage et la culture s'impliquent mutuellement (...) le


langage doit être conçu comme une partie intégrante de la vie
sociale (...)

Je pense que la réalité fondamentale à laquelle le linguiste a


affaire, c'est l'interlocution — l'échange de messages entre émetteur
et receveur, destinateur et destinataire, encodeur et décodeur (Essais,
p. 32).

On peut lire, de même, dans CLG : « II faut une masse parlante pour
qu'il y ait une langue » (p. 112). Cette solidarité existentielle entre langue
et information à transmettre implique, aussi bien pour A. Martinet, que
pour Jakobson ou Troubetzkoy, que le sens est indissociable de la forme,
et que par conséquent l'analyse linguistique ne peut se concevoir sans réfé
rence au sens. Évidemment, cette implication peut paraître contradictoire
avec le postulat de l'arbitraire du signe, selon lequel le signifiant n'ayant
aucun lien objectif avec le signifié ou avec la chose signifiée, le système
formel de la langue constitue la seule référence possible.
C'est qu'en fait l'arbitraire du signe se définit par rapport au réel et
non par rapport à la pensée ou par rapport à la vision par l'homme de ce
réel si bien que pensée et signifié sont identiques. La différenciation opérée
par F. de Saussure oppose le concept — ou signifié — à l'image acous
tique — ou signifiant; son explication se termine néanmoins de façon
ambiguë :

Nous voulons dire qu'il (le signe) est immotivé, c'est-à-dire arbi
traire par rapport au signifié, avec lequel il n'a aucune attache natur
elle dans la réalité (CLG, p. 101).

L'explication d'A. Martinet marque bien qu'il s'agit pour lui d'un
arbitraire par rapport au réel :

(...) l'indépendance de la langue vis-à-vis de la réalité non linguis


tiquese manifeste, plus encore que par le choix des signifiants, dans
la façon dont elle interprète en ses propres termes cette réalité, éta
blissant en consultation avec elle sans doute, mais souverainement,
ce qu'on appelait ses concepts, et que nous nommerions plutôt ses
oppositions (LLS, p. 35).

2. Social renvoie simplement à groupe d'hommes par opposition à individu. De


même la communication est un échange de vues, sentiments, pensées, entre gens de
bonne (et même) compagnie.
Quel que soit le choix philosophique que l'on opère, quant au rapport
homme-pensée-langue-monde réel, la référence au sens dans la description
des unités linguistiques constitue un artefact. Si la pensée est première,
si l'homme pense le réel en dehors des catégories linguistiques, alors la
procédure linguistique est un artefact quand le linguiste se donne le sens
pour définir les unités linguistiques, puisque la langue se définit, par
rapport à la pensée ou à la perception, justement parle sens; si l'on estime
que la pensée est conditionnée par la langue, c'est-à-dire si l'homme ne
pense le réel qu'en fonction des catégories linguistiques, alors accepter le
recours au réel ou accepter celui du sens revient rigoureusement au même,
puisque le réel n'est appréhendé qu'à travers la grille linguistique. En
fin de compte, le fait d'avoir posé au préalable que le signe est arbi
traire et que, par conséquent, le sens pour les uns, le réel pour
les autres, ne peut être une référence dans la description linguistique
n'infléchit en rien cette dernière. Certes les linguistes prennent de grandes
précautions dans la définition de leur méthode : une différenciation fondée
sur le sens doit être reconnue par l'ensemble de la communauté linguistique
et non par le linguiste seul; il n'en reste pas moins que cette référence
peut être considérée comme une violation du principe de non-référence au
sens ou au réel qui découlait du postulat de l'arbitraire du signe, et qu'elle
entraîne, comme on vient de le signaler, une contestation possible de la
validité de l'analyse.
1.1.2. La conception de l'objet implique une méthode.
Le postulat présidant à l'analyse distributionnelle est d'ordre psychol
ogique, se fondant sur une hypothèse quant aux possibilités et limitations
humaines dans le domaine de la communication qui impliquent le caractère
discret des éléments utilisés; la constatation préalable de Harris est à peu
près la suivante : les hommes communiquent entre eux; l'acte de parole ne
peut être une simple suite de sons émis au hasard, on doit donc pouvoir y
déceler des éléments qui se retrouvent dans d'autres actes de parole, par
conséquent isolables et descriptibles.
En revanche, dans le Cours de Linguistique générale, chez Martinet,
Jakobson ou Troubetzkoy, le postulat initial est une assertion préalable
de ce que l'on va découvrir; ainsi, la notion de système chez Saussure
découle de celle d'arbitraire du signe, lui-même dérivé d'un raisonnement
extralinguistique; la langue est un système, car les signes la constituant
étant arbitraires, rien d'autre que la langue ne peut servir de référence, et
les signes se définissent donc les uns par rapport aux autres. On peut dire
que F. de Saussure procède déductivement : sa description linguistique
doit être la vérification du postulat initial. On retrouve le même proces
sus sur le plan de la description elle-même. Reprenons l'exemple de défaire :
à partir de l'assertion (il existe dans le subconscient la connaissance que)
défaire a deux constituants, on le vérifie par deux séries commutables.
A plus ou moins longue échéance, on se heurte à deux difficultés — au
moins — : (1) l'intuition qu'un élément possède deux constituants est
difficilement démontrable — par exemple les cas de ce que A. Martinet
appelle l'amalgame : du, des au... — ; (2) des éléments dont on peut démont
rer qu'ils comprennent plusieurs constituants, ne correspondent plus, une
fois « démontés », à l'intuition — par exemple : ouvr-ier.

De même, dès la page 2 des Principes, Troubetzkoy affirme l'exi


stence d'une structure qui s'applique à la substance — sens ou phonie. On
peut lire (p. 3) :
10

La langue consistant en règles ou normes, elle est, par opposition


à l'acte de parole, un système (...)

Le processus déductif est encore plus net chez Jakobson selon qui le
linguiste doit être un décodeur, c'est-à-dire un interlocuteur, possesseur de
la langue grâce à laquelle il comprend la parole. Le linguiste connaît et se
donne donc non seulement le sens, mais les unités linguistiques elles-mêmes.
Il ne devrait même pas avoir à chercher un système quelconque, d'ailleurs,
puisque :

La faculté de parler une langue donnée implique celle de parler


de cette langue (Essais, p. 81).

En d'autres termes, la capacité linguistique implique la capacité métalin-


guistique. La procédure utilisée emploie donc, sans complexe pourrait-on
dire, des catégories non définies linguistiquement dans la « découverte »
ou le classement des éléments, le recours à la métalangue étant justifié par
le fait que le linguiste est un décodeur. Ainsi, on peut lire dans les Essais
(p. 163) :
Pour procéder à l'analyse linguistique, et décomposer la chaîne
parlée en unités de plus en plus petites, nous commençons au niveau
de l'énoncé. L'énoncé minimal est la phrase. Une phrase consiste en
mots : ceux-ci en sont les plus petits éléments effectivement sépa-
rables. (...) En allant plus loin dans la décomposition de la chaîne
parlée, nous arrivons a la plus petite unité linguistique douée d'un
sens propre (...) Les unités formelles peuvent être décomposées en
unités linguistiques plus petites (...)

En fait, il semble évident que la capacité métalinguistique d'un locuteur,


c'est-à-dire sa faculté de pouvoir décrire sa langue en termes grammaticaux,
n'est pas solidaire de sa faculté linguistique elle-même, mais provient d'une
acquisition scolaire des dénominations grammaticales associées aux ensemb
les des éléments apparaissant effectivement dans la communication. Dans
la mesure où ce type de description traditionnelle est remis en question par
la linguistique, et surtout dans la mesure où ses postulats, sa méthode sont
différents, il est paradoxal d'y recourir dans la détermination linguistique.
1.1.3. Le but de l'analyse linguistique est différent.
En fin de compte, lorsque l'on examine la manière dont ces différents
linguistes procèdent à l'analyse linguistique, il apparaît que les buts de
leur analyse ne sont pas les mêmes. Harris cherche à se donner des concepts
rigoureusement définis, un peu comme en mathématiques où chaque notion
renvoie à un phénomène défini en termes de cette science. A. Martinet, ou
Jakobson, ou Troubetzkoy déterminent abstraitement, c'est-à-dire à
partir d'unités métalinguistiques ce qui peut justifier l'idée de système
postulée préalablement à l'analyse.

1-2. L'identification des éléments et leur classement.


1.2.1. L'identification des éléments л non significatifs ».
Les formulations généralement ambiguës de Martinet ou Jakobson
amènent à constater que la conclusion que l'on déduit de leurs différents
exposés est quelque peu bizarre; on peut sommairement la traduire de la
façon suivante : le phonème est défini par ce qui définit le phonème.
11

Pour Martinet par exemple, l'identification du phonème se fait par


commutation d'éléments « du même type » (?) dans le même environnement.
Ainsi, [b], [p], [v], [f] etc., commutent dans [# — à] (LLS, p. 63), et [b],
ÍP]> lvl> [f] etc-> commutent dans [# — u]. (LLS, p. 64.) Mais on ne peut
ramener les deux [b], [p], [v], [f], etc., ainsi obtenus à un même élément sur
la base du maximum de ressemblance phonique, notion qui « reste très
vague » (LLS, p. 66) :

La véritable solution consiste à identifier les unités dégagées


par commutation non pas du fait de l'analogie de leur structure
phonique qui frappe du fait de leur comparaison deux à deux, mais
sur la base de traits distinctifs qui les distinguent des autres phonèmes
d'une même série : ainsi donc, si nous identifions le [b] de banc et
celui de bout, (c'est) uniquement et exactement parce que nous
constatons que le [b] de banc se distingue des autres consonnes de
la série banc, pan, van, etc., par les mêmes caractéristiques qui assurent
la distinction entre le [b] de bout, et le [p] de pou, le [v] de vous,
le [f] de fou, etc.,
c'est-à-dire que les consonnes en question devant [u] sont phoniquement
différentes de celles devant [â], mais le sujet parlant les assimile à une
même unité.
Il nous semble cependant que la notion même de « trait distinctif »,
impliquant un certain choix parmi l'ensemble de caractéristiques d'un son,
présuppose par conséquent la découverte des phonèmes. On aboutit donc
par commutation à l'identification d'un phonème postulé sur le critère
non défini de changement de sens; ces phonèmes postulés permettent de
dégager les traits distinctifs qui, à leur tour, définissent les phonèmes.
Il existe donc deux phonèmes : l'un correspondant à une segmentation du
corpus, et l'autre reconstruit, défini en termes de traits. Les formulations
de Troubetzkoy, bien que renvoyant au même type de procédure, ne sont
pas ambiguës. Par segmentation et commutation, il détermine des opposi
tionsphonologiques; par comparaison, on peut en décrire la structure (le
système) de traits qui les différencient ou qui leur sont communs, et donc
caractériser le contenu des phonèmes.

Un phonème ne possède un contenu phonologique définissable


que parce que le système des oppositions phonologiques présente une
structure, un ordre déterminés (Principes, p. 69).
On retrouve cette ambiguïté — et le cercle vicieux — dans les exposés de
Jakobson; à la suite du test initial qui isole un certain nombre d'unités,
on définit ces unités les unes par rapport aux autres en fonction de leurs
caractéristiques articulatoires et acoustiques qui, à leur tour, par combin
aison, définissent les unités initiales. On pourrait relever un grand nombre
de citations où le phonème désigne tour à tour le premier type d'unité,
ou l'ensemble de traits.

Ainsi, pour l'identification de /p/, et de tout autre phonème,


la référence à la propriété de chacun de ses traits distinctifs est imper
ative (Prél., p. 12).
Les traits distinctifs sont groupés en faisceaux simultanés appelés
phonèmes (Fundamentals, p. 20).
Les unités formelles minimales peuvent être décomposées en
unités linguistiques plus petites (...) Nous sommes ici à un niveau
plus bas de la sémiosis : le phonème participe à la signification sans
12

peut
avoir être
pourtant
décomposé
de signification
en éléments
propre
plus
(...)petits
A sonettour
simultanés
le phonème
: c'est
(...)
pourquoi j'ai proposé de définir le phonème comme un ensemble
(set) ou un faisceau (bundle dans la terminologie de Bloomfield)
de traits distinctifs {Essais, p. 164-165).
L'identification proposée par Harris est différente, non seulement
parce qu'elle ne se ramène pas à la bizarrerie signalée plus haut, mais encore
parce qu'il n'utilise pas de critères qui ne soient pas définis à l'intérieur
de sa théorie, comme celui du sens. Étant donné son postulat initial, le
premier devoir de Harris est de le vérifier, c'est-à-dire déterminer si l'acte
de parole est effectivement représentable en termes d'éléments discrets.
Le test utilisé est le test connu de « répétition »; par exemple, étant donné
l'énoncé :
Mon père ce héros au sourire si doux
on demande à un locuteur de la langue si l'énoncé (a) et l'énoncé (b) sont
respectivement des répétitions de la phrase initiale :
(a) [торегяэего osurirsidu] mon père ce héros au sourire si doux.
(b) [topsrsaero osurirsidu] ton père ce héros au sourire si doux.
Il ressort de ce test que la première petite partie de l'énoncé initial
a une certaine fonction linguistique. Afin de vérifier si le point en question
est bien une unité discrète, on demande au locuteur s'il est possible de
produire d'autres énoncés où il apparaisse; par exemple :
moule,
modification,
miroir, etc.
Cet élément semble répondre par conséquent à la définition de « dis
cret » : il est isolable, et il se retrouve dans d'autres énoncés; on lui assigne
une marque, par exemple : [m].
Deux éléments x et x' sont des variantes libres, dans cette perspective,
si, étant donné un énoncé xyz, l'interlocuteur le répète indifféremment
sous la forme xyz ou x'yz. On voit donc que Harris ne fait intervenir
le sens en aucune manière; il ne s'occupe pas davantage de savoir de quels
éléments sont constitués les énoncés : à aucun moment par exemple, il ne
s'agit de se fonder sur la signification des morphèmes pour conclure à la
variante libre : on demande à l'informateur de répéter quelque chose, non
de dire si la suite de morphèmes est la même dans un énoncé (a) et dans
un énoncé (b).
On peut se demander si cela ne revient pas au même, en fait, puisque
l'interlocuteur confirme ou infirme la répétition par référence au sens. C'est
que précisément Harris se place sur le plan du décodeur, utilise les oppos
itions possédées par le locuteur de la langue qu'il étudie — et qui peut être
la sienne — et, en ce sens, échappe aux critiques de A. Martinet ou
R. Jakobson à l'égard de ce que ce dernier nomme le « cryptanalyste ц
mais la différence entre Harris et eux, c'est qu'il importe peu que ce soit
ou non le sens qui conditionne la réponse de l'informateur; le linguiste se
contente d'enregistrer les unités sur le critère de la répétition ou non-répétit
ion. La tradition européenne au contraire prend explicitement la signi
fication en considération dans l'identification des unités, bien que ce ne
soit qu'une utilisation faible de la sémantique, en ce sens qu'on ne se
demande pas ce que cela veut dire, mais simplement si cela veut dire quelque
chose ou la même chose; on peut par exemple citer les règles données par
Troubetzkoy :
13
Ire règle : Si deux sons de la même langue apparaissent exac
tement dans le même entourage phonique, et s'ils peuvent être subs
titués l'un à l'autre sans qu'il se produise par là une différence dans la
signification intellectuelle du mot, alors ces deux sons ne sont que
des variantes facultatives d'un phonème unique {Principes, p. 47).
IIe règle : Si deux sons apparaissent exactement dans la même
position phonique et ne peuvent être substitués l'un à l'autre sans
modifier la signification des mots, ou sans que le mot devienne méconn
aissable, alors les deux sons sont des réalisations de deux phonèmes
différents {Principes, p. 49-50).
Pour faible qu'elle soit, il n'en reste pas moins que cette utilisation n'est
pas elle-même définie, dans sa quantité ou sa qualité, par exemple, et que
la notion même de sens ne l'est pas davantage; il ne s'agit pas là d'une
espèce de convention explicite qui serait fondée par exemple sur la consta
tation qu'on ne peut définir le sens, mais plutôt d'une habitude; en effet,
il est couramment question, au départ de l'analyse phonologique, d'autres
notions non définies par l'analyse elle-même. Ainsi, préalablement à l'iden
tification des éléments non significatifs, A. Martinet se pose la question
de savoir quels signifiants on doit soumettre à l'analyse (ELG, p. 66) et
il écarte ceux qui contiennent des pauses virtuelles parce que celles-ci
modifient le comportement du phonème. Ce rejet implique non seulement
la connaissance d'unités linguistiques non encore spécifiées (puisque l'on
débute par l'étude du phonème), telles que la phrase, le mot, les mots
composés, mais encore la connaissance de l'effet de certains environnements
sur les phonèmes, alors que c'est cela même que l'on se donne pour but
d'examiner :
II faut s'abstenir de rapprocher des segments d'énoncés où les
frontières entre les mots ne coïncident pas, et où, en conséquence,
la distinction entre deux segments peut être assurée par des pauses
dans des positions différentes (LLS, p. 51).
On trouve le même type de rejet chez Jakobson :
Si, notre enquête portant sut les phonèmes d'une langue, nous
essayons de dessiner le réseau des combinaisons de ces phonèmes qui
se trouvent effectivement réalisés, nous sommes obligés de faire entrer
en ligne de compte les catégories grammaticales : en effet, les combi
naisons de phonèmes sont différentes au début, à l'intérieur, ou à la
fin d'un mot (Essais, p. 166).
Il n'en reste pas moins que les conclusions, didactiques, font comme si
l'on avait procédé effectivement sans présupposé spécial; ainsi, après avoir
déterminé sur un exemple de tchèque de Bohême que :
II est possible de caractériser les différentes classes grammaticales
d'unités formelles par des listes différentes de phonèmes ou même de
traits distinctifs {Essais, p. 167);
en partant précisément de la connaissance des catégories, R. Jakobson
conclut :
Chaque langue possède un système de traits distinctifs, groupés
selon certaines règles en faisceaux et en séquences; tous ces moyens
servent à distinguer des mots de significations différentes (Essais,
p. 171).
14

On peut donc dire que l'idée émise en 1.1.1, selon laquelle les éléments
linguistiques sont supposés connus immédiatement au lieu d'être découverts
linguistiquement, est vérifiée.
Harris, au contraire, ne présuppose aucunement la connaissance de
catégories grammaticales ou d'unités linguistiques lorsqu'il étudie la combi-
natoire des éléments identifiés. Ainsi, au lieu de se donner la pause, et de
l'éliminer en décidant sans étude préalable qu'elle affecte le comportement
de sons, il commence par étudier le comportement des sons et constate
une différence phonique — que l'on notera ' — pour deux éléments autre
ment semblables, selon que l'environnement qui suit est ou non un env
ironnement zéro. Ainsi, on aura :
[aj] dans minus mais [aj'] dans slyness
[ej] dans playful mais [ej'J dans trayful
La détermination d'une distribution complémentaire constitue également
une approche de la délimitation des frontières de morphèmes; ainsi, les
trois énoncés suivants seront représentés :
analysis : /senselisis/
a name : /зе-neym/
an aim : /sen-eym/ (SL, p. 82).
En dehors du fait que Harris n'utilise pas de critères non définis, on peut
donc dire que ce qui le différencia des linguistes européens, c'est que sa
description est parfaitement cohérente en ce sens que non seulement la
procédure de découverte est la même à tous les niveaux, mais encore qu'il
n'y a pas de coupures entre eux et que, par exemple, ce que l'on a découvert
des phonèmes sert à la découverte des morphèmes, sans que l'on se soit
servi du morphème ou d'autre élément grammatical dans la définition
du phonème.
Peut-être tombe-t-on dans le défaut de Lyons signalé plus haut en
amalgamant dans une « tradition européenne » Saussure aussi bien que
Martinet aussi bien que Jakobson; c'en serait un en tous cas de parler
d'une « tradition américaine » qui engloberait par exemple Bloomfield
et Harris, car Bloomfield utilise la même méthode que les « Européens »
dans son identification des phonèmes. Sans aller jusqu'à éliminer les signi
fiants contenant des pauses virtuelles, il n'en présuppose pas moins lorsqu'il
étudie les phonèmes, la connaissance d'unités linguistiques non encore
définies :

On trouve en anglais des consonnes longues dans des phrases


et des mots composés, comme dans « pen-knife » (LL, p. 105).

De plus pour Bloomfield, l'étude linguistique, au niveau même de


la phonologie, englobe forcément un recours au sens puisque ce qui fait
qu'un trait est distinctif, c'est qu'il est essentiel à la communication, donc
rattaché au sens. Seule la phonétique peut se passer d'une telle référence :

Comme nous ne pouvons pas reconnaître les traits distinctifs


d'une émission, sinon lorsque nous en connaissons la signification,
nous ne pouvons les identifier sur le plan de la phonétique pure (...).
Pour reconnaître les traits distinctifs d'une langue, nous devons
abandonner le terrain de la phonétique pure et agir comme si la
science avait progressé suffisamment loin pour identifier toutes les
situations et les réponses qui composent la signification des formes
du discours (LL, p. 76).
15

Pour Harris, il n'est pas question de faire comme si une telle science
existait. Premièrement, la langue elle-même apporte une limite aux spécula
tionsque l'on peut faire théoriquement. Par exemple, l'acte de parole
peut être découpé de façon illimitée en unités de plus en plus petites,
puisqu'il est linéaire; mais précisément, le propre de l'élément linguistique,
ce n'est pas seulement sa possibilité d'être isolé par segmentation, c'est aussi
sa possibilité, correliée à la première, de commuter avec d'autres éléments.
La limite de la description est donc linguistique et non objective.
On a d'ailleurs cette idée également chez Troubetzkoy ou Jakobson,
à cette différence près que eux se fondent sur les caractéristiques phonétiques
ou articulatoires, et donc sur un plan différent du point de vue des deux
axes syntagmatique et paradigmatique, si bien que la limite linguistique
est « inférieure » au phonème, concernant la simultanéité des traits.
Deuxièmement, la description linguistique également aide le chercheur
à déterminer le statut d'un élément. Ainsi, sur le plan significatif, il est
possible d'après la méthode d'aboutir à des unités qui ne correspondent pas à
l'intuition. Par exemple, les trois phrases suivantes permettent d'identifier
b/g/a/u/r comme des éléments moiphologiques :
Where's the bag?
Where's the rug?
Where's the bug? (SL, p. 158)
Mais b/r, и I a, et g ne constituent pas respectivement une classe distribu-
tionnelle : ils sont les seuls à constituei leur propre classe. Ce critère de
distribution permet donc ici de reformuler les divisions initiales de façon
plus adéquate.
Bloomfield est donc beaucoup plus proche, par ses définitions, ses
postulats, sa méthode, des « Européens » que de Harris, et l'on trouve dans
Le Langage un certain nombre de contradictions qui sont aussi celles des
linguistes européens. Ainsi, on peut lire (LL, p. 24) :

Pour décrire une langue, nul besoin d'un savoir linguistique quel
qu'il soit; en fait l'observateur qui laisse un tel savoir modifier sa
description est poussé à dénaturer ses données. (...) Les seules géné
ralisations utiles sur le langage sont les généralisations inductives.

En fait, cette affirmation préliminaire est mise en contradiction dès le


premier niveau de description linguistique puisque la phonologie : « inclut
la considération du sens » (LL, p. 77) notion non définie, et que Bloomfield
utilise avant l'heure ce qu'on appellera par la suite l'intuition du sujet
parlant : « Dans le cas de notre propre langue, nous faisons confiance à
notre savoir quotidien » (LL, p. 77).
A. Martinet, de même, condamne les linguistes qui procèdent « plutôt
par introspection que par observation directe de la parole » (LLS, p. 2),
et, dit-il : « Le recours au sentiment linguistique ne saurait être considéré
comme scientifiquement recommandable » (LLS, p. 64).
On retrouve néanmoins dans l'analyse le même type de contradiction
signalé pour Bloomfield :

Pour reconnaître le caractère linguistique d'un fait, on procède


à l'opération qu'on appelle aujourd'hui la « commutation » et qui
consiste à remplacer ce fait par un autre de même type afin de consta
ter si le remplacement a une répercussion sur le sens (si le fait est
phonique), sur la phonie (si le fait est sémantique) (LLS, p. 134).
16

Au départ de l'analyse, la notion de « même type » de phénomène, comme le


« recours au sens » ne peut que renvoyer à un jugement du descripteur.
En fait il semble que chez A. Martinet le refus du sentiment linguistique
ne corresponde pas exactement à un refus de l'intuition du sujet parlant
ou du linguiste, mais, comme le montre sa critique des conceptions de Van
Wijk (LLS, p. 96), à un refus de ce qu'un locuteur dirait sur sa langue,
si on lui en demandait la description. Le recours au sentiment linguistique
n'est possible, comme pour Jakobson, que si le locuteur possède une
capacité métalinguistique « officielle ».
On ne peut parler par conséquent de « généralisations inductives »
puisque le linguiste connaît et se donne implicitement les oppositions,
les similitudes, les éléments eux-mêmes. En liaison avec le postulat commun
à Bloomfieltj et Harris, selon lequel : « le langage ne doit son fonctionn
ement qu'à la ressemblance entre des émissions successives » (LL, p. 77),
il y a chez le premier l'assertion supplémentaire que les ressemblances de
forme renvoient à des similitudes de sens. On peut donc dire que la descrip
tion linguistique ne découvre rien, et qu'elle ne fournit pas non plus une
possibilité de découverte des phénomènes non contenus dans le corpus,
forcément clos.
1.2.2. L'identification des éléments supérieurs au phonème.
La définition selon laquelle le morphème est une unité minimale
significative suppose implicitement que le monde du sens, que la situation
à laquelle renvoie une certaine concaténation de morphèmes est segmentable
en constituants plus petits, et que chaque morphème renvoie à un consti
tuant de la situation en question.
Or, on trouve ce type de définition chez tous les linguistes européens qui
ont posé explicitement la question du morphème : Jakobson donne cette
définition dans Preliminaries (p. 14) :

L'unité de sens la plus petite dans le langage est appelée mor


phème.
A. Martinet différencie les différentes informations suivant qu'elles ren
voient au lexique ou à la grammaire, et présuppose également un découpage :

Ce que l'on peut appeler l'articulation linguistique en unités


significatives résulte du fait que, pour exprimer une situation qui
peut bien paraître au sujet comme un tout absolument unique, îna-
naly sable, et irréductible à ses expériences antérieures et à celles
ďautrui, il faudra utiliser une succession d'unités dont chacune a
une valeur sémantique particulière (LLS, p. 16).
Dans le système d'A. Martinet, une telle affirmation paraît contradict
oire, dans la mesure où la notion d'« économie » du langage est précis
émentfondée sur le fait qu'un segment phonologique actualise son sens
en fonction du contexte, au lieu d'être une unité distincte et identifiable. On
peut aussi s'interroger sur la possibilité de représentation d'une situation
en éléments discrets d'une part, sur celle qu'il y ait correspondance entre les
éléments linguistiques et de tels éléments situatîonnels d'autre part, et
enfin sur la manière de concilier une telle affirmation avec le postulat initial
de l'arbitraire du signe.
En dehors de cela, on a toujours le même processus déductif :
définition préalable, de type mécaniste chez Bloomfield — ainsi, le sens
du mot pomme est constitué des : « stimuli internes obscurs d'un type
qui fut associé à un certain moment [du passé du locuteur] aux stimuli
17

d'une pomme » (LL, p. 136) — de type mentaliste chez Saussure : « par


rapport à l'idée qu'il représente, le signifiant apparaît comme librement
choisi (...) » (CLG, p. 105) 3 et vérification — donc généralisation deduct
ive — sur le plan de la langue; par exemple, étant donné l'énoncé : [cegar-
s5mâ3] on segmente la forme en fonction des différents sens qu'elle contient :
[œ/garso/mâ3].
Dans cette perspective, la procédure de commutation est une sorte de
mystification, qui consiste à faire « comme si » on procédait formellement :
[garso] est un morphème, la preuve est qu'il commute avec [/je]. Ainsi,
F. de Saussure ne donne pas de procédure d'identification, mais elle se
déduit de sa définition du mécanisme de la langue :

Quand quelqu'un dit marchons!, il pense inconsciemment à divers


groupes d'associations à l'intersection desquels se trouve le syntagme
marchons! Celui-ci figure d'une part dans la série marche! marchez, et
c'est l'opposition de marchons! avec ces formes qui détermine le choix;
d'autre part marchons! évoque la série montons! mangeons! etc., au
sein de laquelle il est choisi par le même procédé (CLG, p. 179).

L'application de la méthode qui ressort de cette description est celle par


exemple d'A. Martinet (ELG, p. 103), mais ce qui montre sans ambiguïté
que les concepts sont donnés au préalable, c'est le conseil qu'il donne :

Lorsqu'on sait que /kaje/ dans le grand cahier désigne un certain


objet, et que /kaje/ dans le lait caillé indique un état particulier de
certains liquides, on ne perd pas son temps à rechercher si /le/ (lait)
n'est pas ici une unité appartenant à la même classe que /grâ/ (grand)
c'est-a-dire un adjectif, ce qui permettrait d'identifier /kaje/ dans
les deux contextes (ELG, p. 34).

Harris, au contraire, ne part pas d'une définition préalable de ce qu'il


doit et va « découvrir », mais de l'acquis que constitue la description anté
rieure du phonème. Celui-ci a été défini en fonction d'une distribution dans
les énoncés courts; il existe une unité supérieure au phonème, car les restric
tionsd'occurrence qui l'atteignent dans les énoncés longs sont beaucoup
plus fortes. Ainsi, des deux énoncés suivants (SL, p. 156) : pill, welling,
on peut déduire que /i/ se combine avec /1/ de la façon suivante : /i/ + Д/ et
/1/ + /i/. Mais sur des étendues plus longues, /i/ n'apparaît pas dans n'im
porte quelle combinaison avec /1/ : Her eyes were welling. * Her eyes were pill.
Bien plus, ces restrictions ne s'appliquent pas, la plupart du temps, à un
seul phonème mais à des suites : * Her eyes were pill. * Her eyes were eli.
mais : Her eyes were well. Her eyes were welling.

On définit les suites phonémiques indépendantes dans chaque


énoncé comme ses segments morphémiques (SL, p. 157).

Le résumé didactique dans SML de la méthode exposée en particulier


dans SL et FPM implique acquis le bien-fondé de la procédure et marque
mieux la possibilité d'un rapprochement avec les théories de la communicat
ion. Les restrictions de co-occurrence dans le voisinage immédiat sont en
petit nombre, mais inversement plus la séquence de phonèmes s'allonge, plus
les restrictions d'occurrence de l'élément suivant augmentent, comme le
3. En fait, comme le dit Bloomfield, la théorie de l'origine, qu'elle soit mentale
ou physique, n'a aucune importance; dans les deux cas, les linguistes présupposent
la même chose : с pomme (...) ce fruit bien connu... » (LL, p. 136).
LANGAGES № 29 2
18

montre l'exemple simple suivant : après le phonème /k/, on a un nombre n de


possibilités, un nombre plus restreint après /ka/, un nombre encore plus
restreint après /кар/, etc. ; une première approximation est possible quant à la
détermination de suites indépendantes de phonèmes : soit un énoncé qui
commence par un phonème /x/, je note après lui un certain nombre de
possibilités. Au fur et à mesure que la séquence s'étend syntagmatiquement,
ce nombre décroît progressivement. Si ce nombre remonte brusquement à un
moment de l'opération, pour redescendre progressivement à un moment m',
et ainsi de suite, il y a des chances pour que les points culminants corre
spondent au début d'une nouvelle séquence et les moments m', m", etc., à des
fins de séquences. Ces approximations sont vérifiées par de nombreux autres
corpus, et orientées par les acquis de la description phonématique, tel le
comportement des consonnes ou des voyelles dans l'environnement.
On n'a donc pas chez Hakris de définition préalable, mais des constata
tions empiriques. La deuxième remarque à faire, c'est que l'on travaille
sur des énoncés et non sur des éléments. C'est pourquoi il paraît difficile
de concilier fonction et distribution, comme la présentation de Lyons
implique qu'on puisse le faire. Un élément pertinent, chez Martinet en
particulier, est un élément qui a une fonction, c'est-à-dire qui correspond
à un certain choix du locuteur qui veut transmettre une certaine information.
On travaille donc sur un élément qui correspond à la définition du phonème
ou du morphème, et on se demande s'il a une fonction dans l'énoncé dans
lequel il apparaît. Dans la procédure distributionnelle au contraire, on
travaille sur des énoncés dont la comparaison permet d'identifier les él
éments. Et c'est aussi la distribution de cet élément, c'est-à-dire l'ensemble
des énoncés où il apparaît, qui définit la classe à laquelle il appartient.
La troisième différence, entre l'analyse de Harris et les autres analyses,
c'est que le sens dérive (si l'on tient à attribuer un sens aux morphèmes) des
ensembles distributionnels caractérisant un élément, c'est-à-dire de sa classe
grammaticale, et il n'est pas donné au préalable. Ainsi, le verbe croire en
français a différents ensembles distributionnels possibles :
1. N V N (Je crois cette histoire. Pierre croit sa femme, etc.).
2. N V Prép = en N (Je crois en lai. Pierre croit en Dieu, etc.).
3. N V N Adj. (Je crois Pierre coupable. Jean croit Pierre intelligent, etc.).
et bien d'autres encore. Dans chacun de ces ensembles de co-occurrences,
d'autres V sont susceptibles de commuter avec croire, par exemple en 3 :
juger, estimer, etc. On peut attribuer arbitrairement une signification x ou
une signification « donner une qualité » à la liste des morphèmes susceptibles
d'entrer dans le même sous-ensemble distributionnel de la classe V ainsi
constitué (SL, p. 192). Cette procédure, est d'un côté, secondaire, puisqu'elle
ne préside ni à l'identification des unités, ni à leur classement; et d'un
autre côté, elle « est purement conventionnelle; elle n'est pas fondée sur
une information nouvelle quant au morphème, et n'en donne pas quant à
eux, mais elle nous permet simplement de parler du sens des morphèmes »
(SL, p. 190).

1.2.3. Le classement des éléments.


1.2.3.1. La distribution complémentaire.
Selon Harris, l'exigence à respecter, dans l'élaboration d'une gram
maire, est d'essayer d'aboutir à un petit nombre d'unités dont le comporte
ment soit le plus général possible. Cela revient, au fond, à se donner la
contrainte que définit Chomsky dans SS où, condamnant la prétention de
linguistes qui voudraient trouver une procédure de découverte des gram-
19

maires, il se donne une contrainte plus modeste, celle de pouvoir choisir


entre deux grammaires (SS, p. 57-58). C'est également le souci de la sim
plicité de la grammaire, alliée à sa possibilité de rendre compte du maximum
de phénomènes linguistiques qui guide Harris au long de ses travaux.
Ainsi, la notion de distribution complémentaire relève-t-elle de cette
nécessité. Supposons que l'on ait identifié trois éléments linguistiques, qui
se caractérisent par les distributions suivantes :
x:A — В y:A — В z : С — D
С — D
y et z ont chacun une distribution partielle par rapport à x; on peut donc
les grouper sous un même symbole linguistique dont ils seront les deux
réalisations complémentaires. Cela permet de faire l'économie d'un symbole,
et garantit la cohérence de la description où tous les symboles ont la même
généralité.
On retrouve dans le classement des éléments les mêmes types de
procédures que dans leur identification, chez Bloomfield ou Martinet;
Bloomfield a toujours recours au sens; par exemple, le morphème de
pluriel apparaît sous la forme de plusieurs alternants dans les mots : glass/
glasses (/iz/), pen/pens (/z/), book/books (/s/) (LL, p. 198).
Pour Jakobson ou Troubetzkoy, c'est la parenté phonique qui est
déterminante :
IIIe règle : Si deux sons d'une langue, parents entre eux au point
de vue acoustique ou articulatoire, ne se présentent jamais dans le
même entourage phonique, ils sont à considérer comme des variantes
combinatoires du même phonème (Principes, p. 50).

Pour Martinet, la découverte de la distribution complémentaire semble


renvoyer à un processus intuitif :

On parle de variantes combinatoires ou contextuelles lorsqu'on


prend conscience de la différence des réalisations d'un même phonème
dans des contextes différents, c'est-à-dire lorsque cette différence
est assez frappante pour aboutir, comme c'est le cas en espagnol
pour [S] et pour [d], à des descriptions non identiques (ELG, p. 75).

Étant donné, par conséquent, l'identification du phonème telle qu'elle a


été décrite plus haut, on a toujours une procédure deductive qui part de
l'unité abstraite et vérifie ses propriétés sur les données empiriques. Quelle
que soit la validité des critères utilisés dans cette vérification, on a pu
constater que des concepts découverts in abstracto étaient maintenus bien
que les données empiriques les démentent; ainsi Jean-Claude Milner a
montré que les notions d'archiphonème et de neutralisation sont contes
tables 4.
Évidemment, l'exclusion de ce type d'appréhension directe implique
chez Harris la nécessité de spécifications plus grandes, car différentes
unités peuvent être en distribution complémentaire. Ainsi, sur le plan
phonématique en anglais, /t/ apparaît dans des environnements de type

4. Cours de Phonologie, non publié (1967-1968). La thèse est la suivante : la


phonologie structuraliste repose sur l'analyse séparée de chaque forme, sans utiliser
d'autres critères que la distinctivité (c'est une des formes de la séparation des niveaux).
Par exemple en allemand, on a deux mots : Rat « conseil », pluriel : Rate, et Rad
« roue », pluriel : Râder. Phonétiquement, le singulier est identique pour les deux :
[rat], le pluriel est distinct : [rata], [redœr]. Le résultat de l'analyse pour [rat] est
qu'en position finale, la sourde n'est pas distinctive, puisque la sonore ne peut y
20

/ — г/ où n'apparaissent jamais /th/, /ph/, /kh/ dont les environnements


sont par exemple / # — V/ que n'admet jamais /t/. Autrement dit, /th/,
/ph/, /kh/ sont tous trois complémentaires de /t/ mais ne le sont pas entre
eux. On se donne donc comme contrainte que des segments en distributions
complémentaires doivent avoir en commun un certain nombre de caracté
ristiques phonétiques que n'auraient pas les autres segments concurrents;
ainsi, dans notre exemple, /t/ et /th/ ont en commun d'être alvéolaire-
sourd en anglais, et cette combinaison n'est connue ni de /ph/ ni de /kh/
De même sur le plan morphématique, on peut avoir une unité, par exemple
гид qui admet les deux types d'environnements où apparaissent knife et
knive : A гид/knife was destroyed. Several гид/knive -s were destroyed.
Mais knife est en distribution complémentaire aussi bien avec knive qu'avec
wive ou live. On ne peut ici se fonder sur un critère phonématique pour
regrouper deux éléments; car, si la plupart des éléments morphématiques,
en distribution complémentaire n'ont entre eux que de légères différences,
il existe des éléments entre lesquels il n'y a pas d'identité, même partielle,
comme pour good et bett-er. La décision est donc fondée sur la base de
l'ensemble des environnements dans lesquels les éléments apparaissent et
que n'admettent pas les éléments concurrents, par exemple : I'll sharpen
my knife on the whesttone / I'll sharpen my knives on the whetstone distribu
tion non anglaise aussi bien pour wife/wives que pour lifejlives.
La constitution de classes répond ainsi à deux impératifs : un impératif
théorique, comme on vient de le voir, et un impératif pratique dans la mesure
où, s'il est possible de déterminer l'unité supérieure au phonème en exami
nantses restrictions de co-occurrence, puisque le nombre des phonèmes est
fini, en revanche le nombre des unités significatives, qui conditionne un
nombre d'autant plus grand de combinaisons possibles ou non, rend cette
tâche impossible pratiquement. On procède donc à l'examen des différentes
distributions.

1.2.3.2. Les classes de morphèmes.


Cette élaboration des classes de morphèmes ne peut se faire que par
approximation, car peu de morphèmes apparaissent exactement dans la
même totalité d'environnements, et celle-ci est d'ailleurs impossible à
décrire puisque l'on se fonde sur un corpus donné. Il ne s'agit donc pas
d'énumérer la totalité des environnements des morphèmes, ni de conclure
que deux morphèmes appartiennent à la même classe si et seulement s'ils

apparaître; phonologiquement, on a donc un archiphonème dental, qui n'est ni sourd,


ni sonore, noté /T/ : /raT/. Autrement dit, il n'y a pas à supposer une dentale sonore
dans Rad, à aucune étape de l'analyse. En conséquence, il est impossible de prédire
quelles formes auront un [d] dans leurs variantes morphologiques, et lesquelles auront
un [t] — ce qui est normal puisque la phonologie est totalement étrangère à la morp
hologie. Soit à présent l'expérience suivante : un locuteur applique toutes les règles
de la phonologie allemande. Sauf une : il substitue à la réalisation sourde de l'archi-
phonème /T/ une réalisation sonore. C'est là une faute, mais en termes phonologiques,
le caractère non distinctif de la sonorité n'est pas affecté si on substitue toujours la
sonore à la sourde en finale; de ce fait, il n'y a qu'une infraction à une seule règle,
purement phonologique, et qui doit avoir les mêmes conséquences pour les deux unités
Rat et Rad : la forme [rad] devra être interprétée comme une réalisation également
fautive des deux. Or cette conséquence n'est pas vérifiée; suivant tous les témoignages,
une forme [rad] sera systématiquement interprétée comme une réalisation fautive de
Rad, jamais comme une réalisation de Rat. Tout se passe comme si le sujet parlant
savait qu'il y a une sonore dans Rad et que la règle enfreinte ci-dessous est l'assou
rdissement de [d] en finale absolue.
21

apparaissent exactement dans les mêmes environnements. L'approximation


la plus directe consiste à faire l'inventaire de tous les environnements des
morphèmes dans le corpus, et de comparer ensuite ces inventaires. Puisqu'il
ne faut pas s'attendre à trouver des ensembles identiques, quel est le critère
qui va permettre de constituer telle ou telle classe? à partir de quel taux de
différences et/ou de similitudes? On peut se donner différentes contraintes,
par exemple un pourcentage de 80 % d'environnements semblables.
Au lieu de commencer à faire l'inventaire des distributions des mor
phèmes, on peut envisager une procédure qui, dès le départ, amène à grouper
des morphèmes substituables dans le même environnement. On choisit un
morphème apparaissant dans un énoncé, et on essaie de lui substituer un
ensemble d'autres morphèmes. D'une manière ou de l'autre, on aboutit à
des classes d'occurrence de morphèmes. On peut se heurter dans les deux
cas à un certain nombre de difficultés pratiques. Supposons par exemple
que l'on cherche à déterminer si les éléments vin, café, lait appartiennent à la
même classe. Si l'on emploie la première procédure, on obtiendra certain
ement les 80 % d'environnements semblables puisqu'ils ont les uns par
rapport aux autres plus de positions en commun, que par rapport à avale,
ou gloutonnement, ou le, etc.
Si l'on utilise la deuxième procédure d'approximation en revanche,
doit-on conclure qu'ils appartiennent à la même classe puisqu'ils sont
substituables dans des environnements tels que : On peut boire du —
J'aime le — ., etc., ou qu'ils n'appartiennent pas à la même classe en fonc
tion des possibilités et impossibilités suivantes : Du vin blanc, * du lait
blanc, * du café blanc, le lait est blanc, * le café est blanc, * le vin est blanc, etc.
A ce niveau de la description intervient le choix (non justifié sur le
plan linguistique ou méthodologique) du linguiste. En fait, comme pour
bag/гид Jbug ci-dessus, la question du choix ne se résout pas sur le plan
théorique, mais sur le plan pratique, dans la mesure où sa pertinence est
suggérée par la description antérieure, et révélée par la productivité de
l'hypothèse dans la description de la langue. On attribue aux classes ainsi
constituées un symbole arbitraire : X, Y, Z ou N, V, Adj, etc.
Jakobson ne se pose pas le problème de l'identification des éléments
significatifs; présupposant la segmentation opérée, il se donne les catégories
grammaticales : le linguiste
employer différents présupposés (prerequisites) grammaticaux
va
pourг l'analyse phonémique qui l'aideront à extraire les traits distinc-
tifs, configuratifs et expressifs (Fundamentals, p. 18).
Au niveau de la syntaxe apparaissent certaines contradictions avec les
postulats initiaux; ainsi on supposait acquise la notion de structure, de
rapports systématiques entre les éléments. Le postulat est déjà considéra
blementébranlé par l'assertion selon laquelle chaque morphème renvoie à
une signification particulière; pour Jakobson, seuls les groupes de mots figés,
c'est-à-dire qui se comportent comme un seul mot, ont une signification glo
bale, non équivalente à la somme de leurs parties; mais ils constituent un cas
marginal bien que courant (sic, Essais, p. 47) :
Dans la théorie du langage, depuis le haut Moyen Age, on n'a
cessé de répéter que le mot, en dehors du contexte, n'a pas de signi
fication. La validité de cette affirmation est cependant limitée à
l'aphasie ou plus exactement à un type d'aphasie (Essais, p. 51).
Le postulat n'est qu'ébranlé, car Jakobson suppose au niveau sémantique
des invariants qui seraient équivalents aux traits distinctifs sur le plan
22

phonologique. Mais lorsque l'on aborde la syntaxe, l'idée de système est


totalement perdue, Jakobson rejoignant Saussure dans sa conception de
la syntaxe comme un domaine de la parole, et donc de la création indivi
duelle. On peut dire que la notion de structure tient aussi longtemps que
les éléments d'un niveau particulier sont énumérables. Il existe
dans la combinaison des unités linguistiques une échelle ascendante
de liberté. Dans la combinaison des traits distinctifs en phonèmes,
la liberté du locuteur est nulle; le code a déjà établi toutes les possi
bilités qui peuvent être utilisées dans la langue en question. La liberté
de combiner les phonèmes en mots est circonscrite, elle est limitée
à la situation marginale de la création de mots. Dans la formation
des phrases à partir des mots, la contrainte que subit le locuteur est
moindre. Enfin, dans la combinaison des phrases en énoncés, l'action
des règles contraignantes de la syntaxe s'arrête et la liberté de tout
locuteur s'accroît substantiellement, encore qu'il ne faille pas sous-
estimer le nombre des énoncés stéréotypés (Essais, p. 47-48).

Chez Martinet, l'identification des monèmes se fait par segmentation


et commutation, et une signification leur est attribuée en fonction de la
différence de sens constatée dans l'opération initiale. Ainsi, à partir de la
comparaison nous courons (nous courions, dit A. Martinet :

nous poserons donc un monème avec signifié « imparfait » et signi


fiant /i/ inséré dans le complexe avant un /-Ô/ final (ELG, p. 103).

La distribution complémentaire est aussi définie en fonction du sens; ainsi,


on dira que le lexeme all(er) a les variantes /al-/, /va/, /i-/, /aj/ (ELG,
p. 106). En ce qui concerne le classement des éléments, on a d'abord une
détermination sémantique de la fonction du monème; ainsi, dans la phrase :
« Hier, il y avait fête au village »,

le segment il y avait fête peut à lui seul constituer le message, ce n'est


pas à lui de marquer ses rapports avec d'éventuelles adjonctions, et
les compléments sont précisément identifiables comme tels, préc
isément parce qu'ils correspondent à des éléments d'expérience dont
on juge nécessaire de marquer le rapport avec l'ensemble de l'expé
rience à communiquer, rapport qui correspond, sur le plan linguistique,
à la fonction. Le syntagme il y avait fête n'est pas autonome, il est
indépendant. On le désigne comme un syntagme prédicatif (ELG,
p. 124),
et la classe de chaque élément est définie selon la fonction de l'ensemble où
il apparaît. Ainsi, sous la rubrique « Adjectif », on peut lire : « Les monèmes
qui désignent les états ou les qualités sont évidemment susceptibles d'emplois
prédicatifs » (ELG, p. 142).
1.2.3.3. Les classes de suites de morphèmes (Harris).
Aussi bien chez Jakobson que chez Martinet, il n'y a pas de méthode
formelle de classification des unités significatives obtenues; fondée unique
mentsur le sens, elle ne peut être que ad hoc sur le plan de la linguistique
générale, et elle révèle, plus ou moins selon l'un ou l'autre, la perte de l'idée
de système quand on aborde la combinaison des morphèmes entre eux.
Pour Harris, au contraire, la même méthode continue au niveau
« syntaxique », car par commutation dans le même environnement, on peut
constituer un nouveau type d'unité linguistique dont le comportement
sera plus général que celui du morphème seul : les classes de suites de
23

morphèmes. Ainsi, dans un énoncé de type #NV# (qui représente Richard


mange par exemple) sont substituables à N dans l'environnement # — V # :
Dét N (le garçon), Dét Adj N (le petit garçon), Dét Adv Adj N (le tout petit
garçon), Dét Adv Adj N Adj (le tout petit garçon brun), Dét Adv Adj N
Adj Rel V (le tout petit garçon brun qui rit), etc.
On obtient donc un certain nombre d'équations hiérarchisées puisque
par exemple Dét Adv Adj N suppose auparavant Dét Adj N, alors qu'inver
sementDét Adv Adj N ne peut être équivalent à Dét Adv N.
Certains commentateurs ont fait de cette procédure la nécessaire
solution d'un problème qui se posait selon eux dans la détermination des
éléments par application de l'analyse distributionnelle « stricte »; c'est-à-dire
que dans une phrase telle que : Les enfants de ma sœur sont insupportables,
les éléments ma et sont, bien que contigus à sœur, ne sont pas son environne
ment « réel », ne peuvent constituer un critère de classification possible pour
l'élément en question. Cette inadéquation renvoie en fait à la méconnaissance
d'un principe important de l'analyse, et que Harris justifie par exemple
dans SL (p. 255). Pour la détermination des classes de morphèmes en effet,
on ne peut se borner à des environnements plus courts que l'énoncé, d'une
part parce que l'on n'a pas de critère linguistique qui permettrait de choisir
à partir de quel moment la longueur de l'énoncé est pertinente quant à
l'élaboration des classes, et, d'autre part, parce qu'une telle méthode
entraîne différentes classifications possibles pour le même élément; ainsi
en anglais, apparaissent dans les contextes :
-ing : do, have, see, mais non certain
un- : do, certain, et non have, et see seulement si celui-ci est au passé ou au
gérondif.
De même en français, peuvent apparaître dans le contexte : -ment :
lente, libre, cruelle, mais aussi arrange, raffine.
En ce qui concerne l'aptitude d'une grammaire, l'un des arguments les
plus connus depuis Chomsky à rencontre de la linguistique descriptive, est
celui de la récursivité de structures. Il faut cependant mentionner que,
sans employer le mot « récursivité », Harris a introduit dans sa grammaire
la possibilité de produire des phrases de longueur théoriquement infinie.
Il y a en effet deux types d'équation différents, selon que la substitution
peut être répétée ou non; par exemple, étant donnée l'équation N Adj = N,
au N contenu dans le membre gauche de l'équation, on peut substituer la
suite N Adj puisque N Adj = N et N Adj Adj peut être actualisé en français :
poire jaune oblongue par exemple. Il n'existe pas de limite théorique à ce
type de substitution, elle peut être infiniment répétée. En revanche, étant
donnée l'équation : N Nn = N, où Nn désigne un suffixe nominal, par
exemple le -ce de enfance, on ne peut substituer au N à gauche de l'équation
la suite N Nn, puisque cela donnerait N Nn Nn, et que l'on n'a pas par
exemple : * enf an-ce -ce en français. Pour éviter l'ambiguïté, Harris attr
ibue donc un indice à chaque catégorie. Si on écrit par exemple : Adj Nj =
Nx cela indique que la substitution est répétable puisque j'ai le même
indice à gauche et à droite de l'équation. En revanche, on notera : N2
Nn = Nj par exemple, pour marquer la limite linguistique de la substitu
tion dans ce cas.
1.2.3.4. L'analyse en constituants immédiats.
D'autres commentateurs confondent semble-t-il en une même opé
ration cette élaboration de classes de suites de morphèmes et l'analyse en
constituants immédiats qui en découle dans la description de Harris.
Cette confusion est encore accentuée lorsque l'on ajoute que les deux lin-
24

guistes qui l'ont le mieux présentée sont Harris et Wells et que, chez
le second, l'élaboration de classes de suites de morphèmes se fait par
approximations successives sur une phrase actualisée, et dérive de l'analyse
en constituants immédiats. Ainsi, Ruwet écrit (IGG, p. 107).
Dans l'ensemble, ces procédures se ramènent toujours à une
combinaison d'opérations de segmentation et de substitution; étant
donné un énoncé — par exemple, une occurrence donnée de la phrase
(Pierre est arrivé) — on le divise tentativement en un point donné,
et, aux segments ainsi obtenus, on essaie d'en substituer d'autres,
pour voir si les nouveaux énoncés obtenus sont grammaticaux. (...)
Quelle que soit l'utilité heuristique de ces procédures (...) il est imposs
iblede les formaliser complètement : une procédure rigoureuse de
découverte est hors de question.
On retrouve le même type d'interprétation chez Gleason et Lyons par
exemple, encore que celui-ci ajoute que Chomsky et d'autres linguistes ont
formalisé ladite procédure. En fait, chez Harris, il ne s'agit pas de « division
tentative » puisque les classes de morphèmes et de suites de morphèmes ont
été mises en équation antérieurement. Étant donné par conséquent un
énoncé tel que : Ma robe verte est déchirée, représentable par la concaténation
de classes de morphèmes Dét N Adj V Adj, en fonction d'équations anté
rieures telles que : N = Dét N = Dét N Adj... la segmentation se fera avant
V Adj, puisque des équations telles que : Dét N Adj V = x, ou : Dét N Adj
V Adj = y, n'existent pas.
Le fait de dire qu'une phrase ambiguë reçoit deux analyses en consti
tuants immédiats différentes signifie par conséquent que les constituants
ambigus sont susceptibles d'être associés à la fois à un ensemble x d'équa
tionset à un ensemble y d'équations, la concaténation en un point n de x et
celle en un point m de y étant semblables. Ainsi, dans la phrase : Je crois
mon fils malade, le verbe croire peut avoir deux sens : faire confiance ou
supposer. Dans le premier cas, le verbe se caractérise par un ensemble
d'équations de ce type : V = VN = VNAdj = V N qui être Adj, alors que
dans le deuxième cas, on a par exemple : V = VNAdj = V que N être Adj.
En fonction de ces deux types d'ensemble équationnels, on a donc deux
analyses en constituants immédiats : P = N V, V = VN, VN = VNAdj;
P = NV,V = VN Adj.

Le problème auquel se heurte explicitement Harris à ce niveau n'est


pas tant celui de l'ambiguïté que celui de la biunivocité implicite entre
l'ordre des morphèmes actualisés et celui des constituants symboliques.
Ainsi, dans l'analyse de la phrase : My most recent plays closed down (SL,
p. 279), on a cette suite d'équations : P, N4 et V4, T N3 et V2 V*, T N2-s et
Vv V1 Pb, T A N2-s et Vv V1 Pb, T D A N2-s et Vv V1 Pb, si : T = my,
D = most, A = recent, N2 = play, Vv = ed, V1 = close, Pb = down.
Étant donné la solidarité syntagmatique entre V et Pb, on a le choix
dans l'analyse entre mettre Vv antérieurement à ce groupe, ou postérieur
ement à V Pb. Dans les deux cas, l'ordre des constituants n'est pas celui des
morphèmes tels qu'ils apparaissent dans l'énoncé (V1 Vv Pb).
En tout état de cause, ce nouveau type d'unité linguistique qu'est la
classe de séquences de morphèmes permet de résoudre le problème de l'ambi
guïtéauquel on se heurte empiriquement si l'on s'en tient aux classes de
morphèmes, et aussi de simplifier la grammaire, non seulement au sens où
l'on obtient des unités plus générales et en nombre restreint, mais encore
parce que l'on peut grâce à elle donner un statut plus satisfaisant à certains
phénomènes uniques de la langue. Il y a ainsi en anglais des morphèmes
25

distributionnellement très limités, tel le wh- ou le th- qui apparaissent


devant -en, -ere, -at, etc., mais dont la concaténation avec ces derniers les
rend équivalents à la séquence TN 5 par exemple. Ou encore, aucun des
morphèmes appartenant à la classe des Adverbes n'a de distribution équiva
lenteà celles d'éléments n'appartenant pas à Adv. En revanche, la séquence
Adj + ly est équivalente à Adv : They're quite new, They're largely new
(SL, p. 263).
De même en français : 11 a beaucoup évolué. Il a grandement évolué.

1-3. Le résultat.

1.3.1. Conclusion-bilan.
Pour les Européens, on a d'abord l'affirmation d'une réalité : la langue;
c'est son actualisation sous forme d'actes de parole qui prouve son existence.
La langue est de plus une réalité mentale, non seulement à cause de sa loca
lisation psychique, mais aussi par le rapport qui est établi, explicitement
ou implicitement, entre langue et pensée. L'homme utilise la langue pour
s'exprimer; cette utilisation est une caractéristique de son statut humain,
une actualisation de sa faculté de langage. On peut voir là un certain
psychologisme, au sens où l'on estime que, selon la formule du philosophe
grec, « l'homme est la mesure de toute chose », qui explique les présupposés
signalés dans l'analyse linguistique. Le descripteur est le locuteur, et le
locuteur est un descripteur; par sa nature, l'homme est capable de connaître,
et donc d'élaborer une science (humaine). De cette vision de la langue comme
objet mental, dérivent deux caractéristiques : le rapport entre langue et
réel est arbitraire, celui entre langue et pensée nécessaire, non seulement au
sens employé par Saussure ou Benveniste, et renvoyant au fait que pour
un Français, le mot cheval ne peut renvoyer à autre chose qu'au concept
de cheval, mais également au sens où l'existence des deux est correliée :
l'homme pense et utilise la langue, la langue influe la pensée. Ce rapport
nécessaire implique donc aussi une conception idéaliste de l'objet : celui-ci
ne peut être représenté dans sa « réalité »; car, même s'il existe une réalité
linguistique extérieure à l'homme, il ne peut y avoir pour lui d'objet qui
serait « la langue en soi », mais seulement un objet tel qu'il est perçu par
lui, élaboré par la pensée, qu'on ne peut saisir autrement que comme repré
sentation humaine; d'où l'artefact signalé dans l'analyse linguistique,
consistant à se donner, pour décrire la langue en question, le sens, dont la
connaissance qu'il est caractéristique de la langue peut être déduite du fait
qu'il n'est pas isomorphe à toutes les autres langues.
La langue est donc d'un double point de vue une structure : d'une part,
parce que les opérations mentales humaines fonctionnent comme un réseau
de relations, un système logique, et que donc la pensée humaine perçoit
et organise la langue en fonction de ce système; et d'autre part — ce que
l'on peut déduire du premier point de vue — , parce que la langue est une
organisation qui n'a qu'un rapport d'interprétation vis-à-vis du réel, au
lieu d'être produite par lui, dérivée « naturellement » du monde. Le fait
que la langue est une structure n'est pas induit, ou déduit; c'est une affirma
tion préalable solidaire d'une certaine philosophie, d'une certaine métaphys
ique.
Le fait de considérer la langue comme un objet mental privilégie,
d'autre part, un certain type de relation entre l'homme et la langue, qui

5. C'est-à-dire Déterminant + Nom.


26

exclut le social 6 (le domaine de la parole) et l'histoire (puisque l'étude est


synchronique). L'existence de la langue est justifiée par celle de la communic
ation, mais cette dernière n'implique pas tant les rapports sociaux avec
les autres hommes que des besoins psychologiques en quelque sorte dégagés
de contingences matérielles : on parle pour clarifier sa pensée, exprimer une
expérience... On se donne l'homme comme on se donne le phonème, en tant
qu'unité abstraite. Il est significatif à cet égard que le structuralisme s'arrête
antérieurement à la syntaxe ou perde, quand il l'aborde, la notion de
système : il décrit de l'extérieur l'objet qu'il s'est construit et énonce les lois
qui décrivent sa nature; il n'aborde pas la réflexion sur la taxinomie ainsi
obtenue, c'est-à-dire l'étude des mécanismes qui mettent en rapport les unités
isolées.
Chez Harris, on n'a pas de postulats de ce type, qui différencient
langage Да^ие /parole, ou posent l'idée de structure a priori. On n'a pas
non plus de recours au sens : les éléments sont définis uniquement sur des
critères formels; mais la description d'un objet abstrait, dégagé de toute
contingence, n'est que la nécessaire étape d'une progression : Harris continue
vers la syntaxe, et ne refuse pas donc la vérification empirique ou logique
des catégories définies antérieurement; il y a chez lui une croyance au déter
minisme, c'est-à-dire, si l'on en croit Claude Bernard (Introduction à
l'étude de la médecine expérimentale, 1.2. 3.), au« rapport absolu et néces
saire des choses, aussi bien dans les phénomènes propres aux êtres vivants
que dans tous les autres ».
On peut dire que c'est le seul postulat du distributionnalisme, et en
fin de compte la théorie linguistique de Harris, puisqu'elle est un principe
de recherche, une méthode d'explication, et qu'elle aboutit à une construc
tion symbolique. Si Harris se refuse à utiliser le sens, c'est non seulement
parce qu'il n'est pas défini, mais encore parce qu'il renvoie au social; mais
ce social n'est pas un découpage rigide; il ne peut être défini en termes
d'éléments discrets, isolables et descriptibles dans l'abstrait, en un mot,
il n'est pas le fait de la langue, mais de discours. Il n'y a pas chez Harris
l'opposition langue/parole, ou compétence /performance, parce qu'il n'y a
pas non plus de distinction entre l'Homme, essence ou résultante de l'e
nsemble des individus dans la communauté linguistique 7, et l'homme-
individu, qui actualiserait ce savoir commun à tous (langue, compétence)
selon les circonstances. Il n'y a pas non plus le choix entre deux objets,
ni deux linguistiques : celle de la langue et celle de la parole. La description
formelle de données — grammaire, ou si l'on veut structure — est un
concept opératoire qui permet l'étude du phénomène linguistique. Et dans
le même temps, par une sorte de mouvement dialectique, l'application de
cette grammaire aux discours amène la modification de la grammaire.
Il est impossible de confondre structuralisme et distributionnalisme.
Les postulats, les méthodes, les résultats sont différents, et différentes
les implications philosophiques et idéologiques.
1.3.2. Deux motivations à l'analyse du discours.
La langue est donc une construction scientifique; il n'y a pas une struc
ture « en soi » — dérivée de la structure mentale humaine ou autre — qui
6. Social renvoie cette fois à l'existence dans la société de classes distinctes.
Saussure, Martinet ou Jakobson considèrent que la langue est un système commun à
tous (social au sens donné en 1.1.1. (note)) donc indépendant des classes sociales, et
que, en parole, chaque individu a la liberté d'actualiser la langue selon le milieu auquel
il appartient ou auquel il s'adresse.
7. Ci : l'homme éternel des manuels scolaires.
27

vient s'appliquer à une substance quelconque. Le système provient de la


description, il est possible du fait du postulat initial, mais il n'y a de
réalité de la structure qu'autant que les éléments sont structurés. Ce qui
va vérifier l'adéquation de cette description créant la structure, c'est la
détermination du sens, c'est-à-dire a les traits des situations sociales »
(SL, p. 173). Est-ce que le système auquel on a abouti rend compte de
rapports sémantiques? est-ce qu'à partir de lui on peut déterminer des
classes de groupes de phrases caractérisés par le fait que c'est ce groupe,
cet ensemble de relations qui a été émis dans telle situation, dans tel milieu
et non tel autre?
Là encore, le fait que Harris n'élimine pas, antérieurement à l'ana
lyseinitiale, un certain nombre de domaines, tel celui du style (contrairement
à A. Martinet ou Bloomfield), va l'aider à caractériser cette unité li
nguistique supérieure à la phrase. Dans la perspective structuraliste, le style
est descriptible en termes d'écart par rapport à la langue standard que
l'on se donne comme objet. Dans la perspective distributionnaliste, au
contraire, il y a un certain nombre de sous-classes caractérisées par des
distributions particulières, c'est-à-dire solidaires de certains contextes. C'est
ainsi que pinard par exemple, entre dans la classe des N sur la base de dis
tributions telles que : Donne-moi-le — , mais son ensemble distributionnel
est marqué par rapport à d'autres par des co-occurrences de type :
Ce — est dégueulasse (par exemple), par rapport à Ce vin est mauvais.
La première séquence, dans sa totalité, peut être correliée à une situation
sociale différente, apparaissant dans une suite d'énoncés différents de ceux
environnant la seconde séquence.
La deuxième motivation renvoie à une nécessité linguistique. On a
vu que la détermination progressive des classes d'éléments provient de
la nécessité de simplifier la grammaire, c'est-à-dire d'aboutir à des unités
en nombre restreint qui aient le comportement le plus général possible. La
concaténation de classes de suites de morphèmes aboutit à une liste de
structures, or, à l'intérieur de cette liste, on peut constater qu'un certain
nombre de structures peuvent être mises en parallèle, regroupées en une
unité linguistique supérieure, en fonction des co-occurrences semblables
des éléments qui les constituent. Ainsi : He meets us / His meeting us (CCT)
Cardin a créé la robe I la robe a été créée par Cardin. Elle cuisine bien / sa
bonne cuisine.
Et en revanche, un certain nombre de concaténations semblables sont
associées en fait à des ensembles équationnels différents, comme on l'a vu :
| II voit sa femme en rêve / il voit sa femme en Levis
\ II voit sa femme; il rêve . . * II voit sa femme; il « levisse ».
{ Je vais à la manifestation / je vais à la gare.
\ Je vais manifester . . * je vais garer
II y a donc des relations d'équivalence ou de non-équivalence entre les
phrases permettant de définir des types de constructions et des dérivés.
Pourquoi se fonder sur le discours, et non procéder à des comparaisons entre
les concaténations symboliques de la liste définie antérieurement?
D'une part, lorsque l'on enregistre un corpus, la phrase unique est
rare. On a soit un discours — suite de phrases, monologue ou dialogue,
formant un énoncé suivi — soit, en guise de réponse à ce discours, une
expression telle que : « ah oui? », « pas possible! », etc. qui précisément ne
répond pas aux formules des phrases : le discours doit être considéré comme
aussi représentatif de la langue que la phrase. D'autre part, la détermination
antérieure des catégories se fait généralement sur un ensemble hétérogène
de phrases; mais rien ne prouve que ce type d'énoncé suffise à cette défini-
28

tion; il se peut que les morphèmes se définissent autant dans leurs interrela
tions à l'intérieur d'un discours suivi, qu'à l'intérieur d'un énoncé court.
Il se peut que l'on trouve dans l'ensemble des phrases successives d'un même
discours ce que l'on ne peut découvrir dans un corpus consistant en un agglo
mérat de phrases sans rapport entre elles. Enfin, la différence entre énoncé
et phrase dans l'identification et le classement des éléments pose des diff
icultés : en principe, on est censé travailler sur l'énoncé, c'est-à-dire un acte
de parole non encore défini linguistiquement; en fait on se donne le cadre
phrastique, comme le montrent d'ailleurs les exemples. Le fait de prendre
la phrase comme un axiome règle le problème; c'est la solution de Chomsky;
mais le fait de supposer que nous parlons en phrases est un autre postulat
— explicite chez Chomsky, implicite chez Harris lorsqu'il se donne la
phrase comme énoncé au départ de l'analyse — , et que les grammaires
doivent caractériser les phrases produites et à produire en est un troisième,
d'où des formulations consciemment ou inconsciemment vagues dans les
travaux se réclamant des théories génératives :

On devrait pouvoir attendre de la grammaire de la langue qu'elle


offre au moins une caractérisation de l'ensemble des objets qui sont
des phrases *, c'est-à-dire qu'elle devrait permettre à son utilisateur
de construire une liste ou une enumeration de ces énoncés » (TAS).
Le but d'une grammaire est de caractériser tous les énoncés «
de la langue (TAS).
Les règles de la grammaire française doivent permettre de former
et d'expliquer toutes les phrases * que les locuteurs français consi
dèrent comme appartenant à leur langue. Chaque sujet parlant porte
en effet sur les énoncés • produits des jugements de grammaticalité
(DD).
La grammaire d'une langue doit projeter le corpus fini et toujours
plus ou moins accidentel des énoncés 8 observés sur l'ensemble (pr
ésumé infini) des phrases 8 grammaticales (SS).

Harris tâche donc de résoudre cette ambiguïté en se donnant pour


cadre explicite le discours, dont l'analyse va permettre de déterminer le
type de relation entre phrases dont on parlait tout à l'heure: la transfor
mation, sans, il faut le reconnaître, que la définition et le statut de la phrase
reçoivent leur solution. En effet, d'une part, les classes d'équivalence sont
toujours établies à l'intérieur de la phrase, appréhendée intuitivement ou
sur une base graphique. Si l'on reprend l'analyse de Harris, telle qu'il la
présente dans Discourse Analysis, sur le texte : Millions Can't Be Wrong!,
on voit que, sur la base du contexte commun « can't be wrong », Harris
établit la classe d'équivalence :
Millions
Four out of five people in a nationwide survey
alors qu'à la gauche de ce « can't be wrong » qui justifie la mise du second
segment dans cette classe d'équivalence, il y a en fait :
Millions of consumer bottles of X-have been sold since its introduction
a few years ago. And four out of five people in a nationwide survey says that
they prefer X- to any hair tonic they've used. Four out of five people
Et, d'autre part, la notion d'équivalence entre phrases est définie plus
par les éléments constitutifs de ces phrases :

8. C'est nous qui soulignons.


29
N1 V N1 n'est pas équivalent à N1 est V-é par N*, car la der
nière forme n'est trouvée que pour certaines occurrences de N1
et N2 (I saw you et / was seen by you {!)), mais non pour toutes les
occurrences (on ne trouvera pas Casals is played by the cello (2)) (DA).

que par leur environnement, puisqu'il suffit, pour que deux phrases soient
équivalentes, qu'elles apparaissent dans le même texte, voire dans la même
langue :

Deux phrases dans un texte sont équivalentes simplement si


elles apparaissent toutes deux dans le texte. (...) De la même façon,
deux phrases dans une langue sont équivalentes seulement si elles
apparaissent toutes deux dans la langue (DA).

Il va sans dire que les reproches que l'on peut faire à cette procédure
ne l'empêchent pas d'être productive, comme l'ont montré de très nombreux
travaux; on peut lire pour s'en convaincre les différentes analyses présentées
dans Langages 13 ou Langue française 9 par exemple. Mais comme on
Га vu, elle suppose le problème de la phrase résolu, ce qui est gênant du
point de vue de la théorie.

II. Les deux définitions possibles de la phrase.

Dans la mesure où la description allait de l'élément le plus petit vers


l'élément le plus grand, celui-ci étant donc défini en tant qu'il est constitué
par quelque chose, on a un premier type de définition de la phrase qui corre
spondà cette procédure et qui consiste à caractériser la phrase en tant qu'elle
est un sous-ensemble de la multitude des combinaisons possibles à partir
des éléments qui la constituent. Ainsi, soient les éléments Dét, Adj, N, V par
exemple, on peut avoir un nombre infini de combinaisons à partir d'eux,
telles :

Dét Dét Dét VWVVWV


Dét NNN V Adj
DétN V
Dét Adj Adj Adj N V, etc.
mais seul un sous-ensemble de ces combinaisons (ici les deux dernières)
appartient au français. Le deuxième type de caractérisation possible
consiste à se donner un critère défini à l'intérieur de la théorie, par exemple x,
tel que si x s'applique à une séquence donnée ou à un ensemble de séquences,
alors cette séquence (ou ces séquences) est une phrase. La définition de la
phrase en termes de classes de morphèmes relève du premier type; en relève
également une autre caractérisation possible, qui ne part plus d'une phrase
que l'on se donne et que l'on décompose en ses éléments constituants, mais
qui part d'un discours et le segmente en un certain nombre de structures.
Ces structures sont elles-mêmes décomposées non pas en leurs constituants,
mais en une structure identique plus quelque chose; cette autre caractérisa
tion possible, c'est ce que Harris appelle l'analyse en chaîne.

(1). Je vous visf je fus vu par vous.


(2). Casais est joué par du violoncelle.
30

II-l. L'analyse en chaîne.


L'analyse en chaîne — exposée en particulier dans ISA — , est ulté
rieure de dix ans aux premiers développements de l'analyse transformation-
nelle; nous présentons la première avant la seconde pour faciliter l'exposé.
Étant donné un énoncé, et la connaissance des morphèmes ou classes
de morphèmes, on se demande (ou on demande à un informateur) si telle ou
telle séquence est une phrase (cf. ISA); par exemple : Mon père, ce héros
au sourire si doux, est un parachutiste qui s'intéresse à la nocivité des champi
gnonset des insectes. Il vient à Paris de temps en temps pour se tenir au courant
des travaux sur les fongicides et les insecticides.
On peut décrire cet énoncé comme la concaténation des classes de
morphèmes suivante (on englobe Article + N sous N, puisqu'il ne s'agit là
que d'une illustration simple), si l'on admet que :
N = nom (Art + nom)
P = préposition
Adv = adverbe
A = Adjectif
Rel. = pronom relatif
Pron = pronom personnel
С = conjonction de coordination :
N1 N2 P1 N3 Adv A V1 N4 rel V2 P2 N6 P3 N6 G N7 Pron V3 P4 N8 Adv2 Ps
Vinf P6 N9 P7 N10 P8 N11 С N12.
Proposons arbitrairement à l'informateur les séquences suivantes,
— étant entendu qu'on lui présente le maximum de combinaisons possibles.

Séquences Actualisation Réponse


N1 N2 (mon père ce héros); —
N1 P1 N3 (mon père à ce héros) —
N2 V1 (ce héros est) —
N2 V1 N4 (ce héros est un parachutiste) +
N1 V1 Rel V2 (mon père est qui s'intéresse) —
N1 V2 P2 N5 (mon père s'intéresse à la nocivité) +
N1 V1 N4 (mon père est un parachutiste) +
p2 j^5 рз ^6 (à la nocivité des champignons) —
N1 V2 P4 N8 (mon père s'intéresse à Paris) +
G N7 Pron V3 (et des insectes il vient) —
Pron V3 (il vient) +
Pron V3 P5 Vinf P6 N9 (il vient pour se tenir au courant) +
Vinf Pe N9 (se tenir au courant) —
etc.

Si d'ores et déjà, on examine les séquences acceptées comme phrases


par l'informateur, on obtient :

N2 V2
N1 V1 P4
N4 N5
N8 (ce héros
(mon pèreest
s'intéresse
estununparachutiste)
parachutiste)
à Paris)
la nocivité)

Pron V3 (il vient)


Pron V3 P5 Vinf P6 N9 (il vient pour se tenir au courant), etc.
On obtient donc un ensemble de structures, définissables comme des
séquences de morphèmes, et qui apparaissent comme étant des phrases.
31

La phrase est définie en premier lieu comme la séquence minimale acceptée


par l'informateur; on l'appelle « chaîne centrale ».
Ces chaînes centrales peuvent être assorties d'un certain nombre d'autres
séquences, qui, elles, ne sont pas isolément acceptées en tant que « phrases »,
par insertion ou addition. Par exemple, si l'on prend la chaîne centrale :
N2 V1 N4 (ce héros est un parachutiste)
seront également reconnues comme phrases les chaînes telles que :

N2 Adv
Adv2
P1 N2
N3AV1
Adv
V1N4
N4A V1 N4 (de
(ce
(ce temps
héros si
audoux
en temps
sourire
est
ce héros
si doux
un parachutiste)
est est
un parachutiste)
un parachutiste)
etc.

On a donc la description de deux types de structures : l'ensemble des


chaînes centrales de la langue, et l'ensemble des chaînes qui peuvent s'ad
joindre à ces chaînes centrales, et les conditions de ces adjonctions.
Il y a en effet des contraintes. Par exemple, certaines séquences ne
peuvent s'ajouter qu'à certaines autres : je ne peux avoir :
*N V1 P1 N3 Adv A (mon père est au sourire si doux)
♦Pron P1 N3 Adv A V3 (il au sourire si doux vient)
mais je peux avoir :
N1 P1 N3 Adv A V1 (mon père au sourire si doux est...)
N2 P1 N3 Adv A V2 (ce héros au sourire si doux s'intéresse...)
Ou encore, certaines chaînes ne s'ajoutent qu'à droite ou qu'à gauche;
par exemple :
♦pi n3 Adv A N2 V1 N4 (au sourire si doux ce héros est un parachutiste)
N2 P1 N3 Adv A V1 N4 (ce héros au sourire si doux est un parachutiste)
N2 V1 N4 P1 N3 Adv A (ce héros est un parachutiste au sourire si doux)
D'autres adjonctions encore sont susceptibles d'être répétées; par
exemple, sur la chaîne centrale :
N1 V2 P2 N5 (mon père s'intéresse à la nocivité)
je peux avoir :
N1 N2 V2 P2 N5 (mon père ce héros...)
N1 N2 N4 V2 P2 N5 (mon père ce héros un parachutiste)
de même en ce qui concerne la classe С :
N1 V2 P2 № P3 N6 С N7 G N2 С N4... (mon père s'intéresse à la nocivité
des champignons et des insectes et des héros et des parachutistes...)
La description de l'ensemble des chaînes centrales est donc assortie
d'une description de l'ensemble des adjonctions, si bien que :

(1) L'ajout de chaque adjonction à toute phrase à laquelle elle


peut être accolée doit aboutir à une phrase.
(2) II y a un nombre fini de structures d'adjonctions, tout comme
il y a un nombre fini de structures centrales.
(3) Chaque structure d'adjonction peut être ajoutée à plus
d'une structure (ISA).

Le résultat final de cette analyse en chaîne est donc une structure


en termes d'ensemble de chaînes chacune étant une séquence de classes
grammaticales, et les classes étant des agrégats de mots ou de mor
phèmes tels qu'elles soient nécessaires et suffisantes pour distinguer
les différentes chaînes, et leurs points d'insertion (ou d'adjonction) :
(1) II y a un ensemble de structures centrales;
32

(2) et un ensemble de structures d'adjonctions, chacune pouvant


s'ajouter à une place spécifiée en fonction de classes ou chaînes (centre
ou adjonction) ou parties de chaînes grammaticales;
(3) chaque chaîne centrale comprenant un nombre zéro ou plus
d'adjonctions est une phrase (ISA) ".

II-2. La transformation.

De même que l'analyse en chaîne, l'analyse transformationnelle ne


consiste pas à décomposer la phrase en ses constituants et ceux-ci en de
nouveaux constituants jusqu'aux constituants ultimes, mais à ramener
une phrase à une structure-noyau et à noter les opérations ou transformat
ions qui en ont fait la phrase complexe telle qu'elle a été actualisée. La
différence entre les deux analyses, c'est que si l'analyse en chaîne décrit
toujours la phrase en tant que concaténation d'éléments, l'analyse trans
formationnelle la décrit comme un produit de transformations. Il y a donc
eďpremier lieu la description d'un certain nombre d'opérations, c'est-à-dire
de quelque chose, mettons x, qui produit des phrases. Si par la suite, on se
trouve devant une séquence quelconque où l'on puisse reconnaître la pré
sence de x, ou bien où l'on puisse appliquer x, alors cette séquence est vra
isemblablement une phrase. C'est le deuxième type de caractérisation de la
phrase que l'on mentionnait en И.О.
II.2.1. Définition de la transformation.
Hakris a montré que l'on pouvait faire une description de la phrase
en termes de constituants imméditats (FMU) — et on peut penser qu'il a
réussi cette démonstration puisque Chomsky dit lui-même qu'il est parti de
ces travaux pour élaborer la grammaire generative en modifiant simplement
la procédure (TAS). On a donc la description en termes de classes d'un
ensemble de phrases qui appartiennent à la langue. Est-il possible à partir
de cette description de déterminer des types de constructions auxquels
peuvent se ramener toutes les phrases de la langue?
Soit un type A (cf. IT) qui se caractérise par la concaténation déclasses
В + С, toutes les combinaisons de В + С n'apparaissent pas dans la langue,
si vaste que soit le corpus que l'on prend. Un premier type de restriction
s'explique par des raisons grammaticales, comme celle de la distribution
complémentaire en fonction de l'accord, qui exclut une combinaison telle
que * Pierre viennent.
Un deuxième type d'élimination s'explique par les restrictions de co
oc urrence : elle est fonction de certains choix de mots (C - CT). C'est-à-dire
que la combinaison В + С n'est satisfaite que par un nombre n de В appa
raissant avec un nombre n de C; c'est ce que Harris appelle les « n-tuples »
de В et С : Pierre mange. *Le livre mange.
Mais on s'aperçoit également que des constructions différentes, c'est-
à-dire relevant par exemple de types D, F, ou G, admettent ou éliminent
les mêmes choix de mots, dans un ordre différent, et /ou avec diverses addi
tions : Est-ce que Pierre mange? * Est-ce que le livre mange? Pierre ne mange
pas. *Le livre ne mange pas. C'est Pierre qui mange. *C'est le livre qui mange.
On s'aperçoit d'autre part que les occurrences de В et de С dans A ne

9. On peut faire la vérification de cette description par un automate à simplifica


tion cyclique, comme le montre Harris dans l'article : « A Cycling Cancellation Auto
maton for Sentence Well-formedness » (1966, International Computation Centre Bullet
in,6).
33

sont pas forcément les mêmes dans une construction différente E; par
exemple, pour N est N, et N a N : L'homme est un animal / L'homme a un
animal. L'homme est un artiste / *L'homme a un artiste. * L'homme est une
maison j L'homme a une maison.
On peut donc opérer une sélection dans l'ensemble initial des phrases,
de façon que chaque forme de phrase, — c'est-à-dire chaque description
symbolique — soit la transformée de l'une (ou de l'autre) forme de cet
ensemble qui sera dit « ensemble de base ». Ainsi, dans les exemples ci-dessus :
A (= NV) est une forme de base, et les formes :
est-ce que NV?
N ne V pas
c'est N qui V
sont des transformées de NV.
La relation de transformation est donc essentiellement formelle, c'est-
à-dire fondée sur la comparaison des co-occurrences individuelles des mor
phèmes constituant les constructions étudiées. Les constructions différentes
dont les membres ont les mêmes co-occurrences et les mêmes restrictions de
co-occurrence seront dites les transformées les unes des autres.

Si deux ou plus constructions (ou séquences de constructions)


qui contiennent les mêmes n classes (quoi qu'elles puissent contenir
d'autre) apparaissent avec les mêmes n-tuples de membres de ces
classes dans le même environnement phrastique, on dit que les cons
tructions sont des transformées l'une de l'autre, et que chacune peut
être dérivée de l'autre par une transformation particulière. Par
exemple, les constructions N Vv N et N's Ving N contiennent les
mêmes triplets : N, V, N, et tout choix de membres que nous trouvons
dans une phrase, nous le trouvons aussi dans l'autre : He met us, His
meeting us; The foreman put the list up, The foreman's putting the list
up, etc. » (C-GT).

Ainsi, même si l'on a quelques exemples possibles de mêmes


co-occurrences pour deux constructions telles que N1 V N2 et N2 V N1 :
Marie voit Pierre / Pierre voit Marie. L'art imite la nature f la nature imite
l'art. (C - CT), ces deux constructions ne seront pas reconnues comme étant
les transformées Tune de l'autre, car pour l'ensemble des co-occurrences pos
sibles de N1 V N2, il est impossible d'avoir N2 V N1 : Pierre écoutait La Sonate
Clair de Lune. *La Sonate Clair de Lune écoutait Pierre. Pierre but sa coupe
de champagne. *La coupe de champagne but Pierre.

Cette exclusion de telle ou telle possibilité, fondée sur des raisons sta
tistiques, est évidemment contestable dans la mesure où elle peut se ramener
à une élimination plus ou moins arbitraire par le linguiste. C'est pourquoi
Harris se donne une contrainte supplémentaire pour pallier cette insuff
isance de la notion de co-occurrence : celle de l'acceptabilité égale des
phrases en question.
Lorsque l'on parle de « élimination plus ou moins arbitraire », cela
signifie qu'en effet, il n'est pas évident a priori que le nombre d'impossib
ilités quant à une transformation éventuelle N г VN2, N2 V N1 soit inférieur
au nombre de celles qui, par exemple, peuvent faire remettre en question la
validité de la transformation actif / passif, puisque, s'il y a des passifs dont il
paraît difficile de dire qu'ils proviennent de constructions actives : Je suis
dépitée I On me dépite (?) ou encore : Je suis stupéfaite par son attitude
alors que stupéfaire n'existe pas, on peut dire aussi que le rapport entre
co-occurrences peut changer lorsque l'on passe d'une forme à l'autre, puisque
LANGAGES № 29 3
34

Ton emploie couramment bon nombre de phrases à l'actif qui paraissent


malencontreuses au passif : J'ai aperçu un chat f Un chat a été aperçu par moi

II. 2. 2. L'acceptabilité.
La première condition d'équivalence est donc au préalable la contrainte
des mêmes membres des classes constituant les constructions. Si l'on prend
par exemple les deux formules de phrases :
NYN
N est Vé par N
mais qu'on n'actualise pas les symboles des classes par les mêmes membres
de ces classes, on est conduit à dire que : Pierre aime Marie et La souris est
mangée par le chat sont des transformées l'une de l'autre, ou que ces deux
constructions n'ont rien à voir. La seconde condition est la (les) modifica-
tion(s) grammaticale(s), puisque si ni permutation, ni ajout, ni effac
ement, etc., n'interviennent, N V N par exemple reste N V N, c'est-à-dire qu'il
n'y a pas de transformation.
La troisième condition est l'acceptabilité des phrases. Cette notion
d'acceptabilité est couramment utilisée en linguistique descriptive, et n'est
pas liée, et encore moins identifiée, à la signification. Il s'agit simplement
pour le sujet parlant d'accepter ou non une phrase, de reconnaître ou non
qu'elle appartient à la langue en question. Après avoir fait toutes les mani
pulations possibles sur une phrase donnée, on reconnaîtra comme transfor
mées l'une de l'autre les phrases également acceptables. Par exemple (TLS),
pour la construction N1 V N2 P N3 en anglais, on a : The man mailed a letter to
a child (acceptable); pour N1 V N3 N2 The man mailed a child a letter (accep
table); pour N2 was Ven (by N1) P N3 The letter was mailed (by the man) to a
child (acceptable); pour N1 V N3 P N2 The man mailed a child to a letter (non
acceptable); pour N1, N2, VPN3 The man, a child, mailed to a letter (non
acceptable), etc.
Seront reconnues comme transformées les trois premières construct
ions. De même en français :
N1 V N2 P N3 Pierre envoie une lettre à Marie (acceptable).
N1 V P N3 N2 Pierre envoie à Marie une lettre (acceptable).
N2 est V-é (par N1) P N3 Une lettre est envoyée (par Pierre) à Marie
(acceptable).
N1 V N3 P N2 Pierre envoie Marie à une lettre (non acceptable).
Mais on est aussi conduit à distinguer des niveaux d'acceptabilité. Si
l'on prend l'exemple suivant :
1. Le chien a mordu la marquise.
2. La marquise a été mordue par le chien.
3. La marquise a mordu le chien.
4. Le chien a été mordu par la marquise.
2, 3, 4 constituent toutes des manipulations sur 1, et cependant, bien
qu'elles soient toutes quatre des phrases du français, 3 et 4 ne sont pas aussi
« naturelles » que 1 et 2. On imagine aussitôt une situation particulière, ce
qui ne se passe pas pour les deux premières; autrement dit, 1 et 2 sont
également acceptables, 3 et 4 sont également acceptables, mais 1, 2 et 3,
4 ne sont pas également acceptables, si l'on compare une paire par rapport
à l'autre.
Certes, cette notion d'acceptabilité est difficilement définissable sur
le seul plan de la linguistique car, sans chercher à réfuter le postulat de
l'arbitraire du signe, il nous semble de bonne foi d'affirmer que la langue
35

est solidaire du réel, et que c'est sur les propriétés de ce réel — qui, dans
des domaines géographiques donnés, paraît courant, ou possible, ou imposs
ible— que se fondent les appréciations d'une communauté linguistique
pour accepter une expression qui, selon ce à quoi elle renvoie, sera jugée
courante, ou possible, ou impossible. Autrement dit, l'acceptabilité est liée
à la sémantique : Si X dit que la phrase : Le champignon a mordu le convive
n'est pas française, Y peut toujours rétorquer que ce n'est paš une phrase
inacceptable puisqu'il existe des fleurs carnivores ou des haricots sauteurs.
C'est à ce type d'argument que nous faisons allusion lorsque nous parlons
de situation particulière : Y prend en considération un réel qui n'est pas
celui du découpage sémantique de la langue.
S'il existe dans telle ou telle langue un mot renvoyant à une réalité
particulière, c'est que celle-ci a conditionné un certain découpage sémant
ique. Cette réalité ne devient accessible — et l'expression qui y renvoie
acceptable — pour le français que lorsque, par l'emprunt, la traduction,
ou la composition de mots, tel objet ou phénomène étranger est importé,
et devient donc à la fois partie du réel et de la langue importateurs.
Lorsque nous disons que l'acceptabilité est fondée sur le réel, cela ne
veut pas dire que nous assimilions réel et vérité. La phrase : Le chien a mordu
la marquise est acceptable même si l'événement auquel elle renvoie n'est
pas arrivé en fait. Et au contraire, qui eût pu penser que : Le professeur a
mordu les mollets d'un étudiant pourrait renvoyer à un événement réel?
Cela ne signifie pas non plus que nous assimilions acceptabilité à
compréhensibilité. L'énoncé : moi pas savoir est doué de sens, mais non
acceptable.
Mais nous voulons marquer le fait que l'acceptabilité est solidaire à
notre avis de la probabilité de l'événement ou de la prédication en question,
dans le monde où l'on se trouve, une fois reconnu le fait que les énoncés
répondent aux descriptions de phrases grammaticales; c'est pourquoi, même
si ce n'est pas vrai au moment où on le dit, la phrase : Le chien a mordu la
marquise est acceptable, au contraire de : La terre est carrée.
Autrement dit, le contexte de la phrase est, à notre sens, essentiel en ce
qui concerne l'acceptabilité, car le rôle du contexte est de nous placer dans
un certain monde. Par exemple, dans un livre de Lewis Carroll, on accep
terait des phrases telles que : Le champignon a mordu le convive.

« Restait à manger les dragées; ce qui n'alla pas sans bruit ni


confusion, car les grands oiseaux se plaignirent de ne pouvoir en sent
irle goût et les petits s'étouffèrent si bien qu'il fallut leur taper dans
le dos. Alice au Pays des Merveilles (traduit en 1963 in coll. Marabout).

Au moment où Harris commence à en parler (IT, 1956), il ne donne


pas de solution réellement satisfaisante quant au critère d'acceptabilité :

« Le sens (...) n'est pas le meilleur critère, non seulement parce


qu'il est difficile a déterminer, mais encore parce qu'il est trop indi
viduel : Chaque phrase a un sens qui peut différer de celui de toute
autre phrase, d'une manière ou d'une autre. Chaque phrase a aussi
une propriété d'acceptabilité, puisqu'elle peut être pleinement natur
elle, absurde, à peine grammaticale, etc. La plupart des phrases sont
en gros équivalentes à cet égard, et c'est ce critère que nous prendrons
en considération ici. »

II est d'autant plus difficile, du point de vue de la théorie, de régler le


problème de Г acceptabilité préalablement aux transformations, que ce sont
précisément les transformations qui doivent en constituer la solution.
36

L'acceptabilité, en effet, est liée au choix des mots dans une même
construction; or il y a des constructions qui admettent les mêmes choix
de mots, comme on Га vu. On peut donc faire l'hypothèse qu'à partir de la
liste finie des constructions admettant les mêmes choix de mots, il est pos
sible de définir le lien qui existe entre le choix des mots et l'acceptabilité,
pour toutes les phrases de la langue.
Le moyen de résoudre le problème que l'on vient de signaler est de prendre
un informateur et de lui demander de donner plusieurs exemples de telle ou
telle construction en gardant les mêmes mots, ou inversement, plusieurs
exemples de mots pour la même construction. Il y a des chances que, spon
tanément, il ne donne que des phrases acceptables dans la langue en ques
tion. Ce test expérimental constitue la base d'un traitement grammatical
plus approfondi.
Soit une construction, N1 V N2 par exemple, on se demande quelles sont
les valeurs de chacun des symboles la satisfaisant. Pour des raisons pra
tiques, on procède par ordre, c'est-à-dire que dans un premier temps, N1
sera variable et V N2 invariables; dans un deuxième temps, V sera variable
et N1 et N2 invariables, et dans un troisième temps, N2 sera variable, N1 V
restant invariables. Ainsi, supposons que pour des valeurs invariables Vх
Ny, on ait trois sous-ensembles de N1, Na, Nb, Nc, où toutes les valeurs
de Na seront également courantes, celles de Nb possibles dans un certain
contexte, et celles de Nc impossibles; on établit ce que Harris appelle une
« échelle d'acceptabilité » sur N Vх Ny, e'est-à-dire une hiérarchie caracté-
risable entre les sous-ensembles de N. Par exemple :
Na Vх Ny : L'artiste a peint une nature morte.
Nb Vх Ny : Le singe a peint une nature morte.
Nc Vх Ny : Le radiateur a peint une nature morte.
Étant donnée cette échelle pour N Vх Ny, on retrouve la même échelle
d'acceptabilité pour d'autres constructions, par exemple Ny est Yx-é par
N:
/par Na : Une nature morte est peinte par l'artiste.
/par Nb : Une nature morte est peinte par le singe.
/par Nc : Une nature morte est peinte par le radiateur.
En fait, l'échelle n'est pas toujours conservée pour les mêmes choix de
mots, à travers des constructions qui sont par ailleurs satisfaites par les
mêmes choix de mots : Pierre a écrit deux heures. Pierre a écrit deux articles
(où dans ce cas, N1 V sont invariables et N2 variable). Pour : N2 est V-é
par N1, on obtient : * Deux heures sont écrites par Pierre. Deux articles sont
écrits par Pierre.

C'est que les choix de mots constituent un ensemble caractérisé par un


ensemble de transformations déterminées; par exemple : Pierre a écrit deux
heures /pendant deux heures mais *Deux heures sont écrites par Pierre, et au
contraire Pierre a écrit deux articles j* pendant deux articles. Deux articles
sont écrits par Pierre.
Autrement dit, l'ensemble de choix de mots, c'est-à-dire l'acceptab
ilité, est caractérisé par un ensemble specifiable de propriétés syntaxiques.
Celles-ci sont mises en évidence par des paraphrases différentes, c'est-à-dire
que des transformations différentes en rendent compte.
II . 2 . 3. Le statut du sens.
On aboutit à la constatation empirique que les phrases transformées
sont équivalentes sémantiquement, c'est-à-dire aue le sens est lié aux
37

co-occurrences des morphèmes. Cela n'est pas surprenant puisque les


co-occurrences possibles apparaissent dans les phrases-noyaux, c'est-à-dire
les formes de base, et qu'elles restent les mêmes dans les transformations de
cette forme de base.
« Les restrictions qui déterminent quel membre d'une classe appar
aîtavec quel autre de la classe voisine sont contenues dans la liste des
phrases actualisées qui satisfont à chacune des constructions du noyau.
Par leur nature, les transformations n'affectent pas les co-occurrences.
Les co-occurrences de mots dans toutes les phrases de la langue sont en
général celles des phrases -noyaux, si bien que les seules restrictions
qui restent en dehors du noyau sont les plus lâches, c'est-à-dire
celles qui déterminent quelle phrase se combine avec quelle autre
phrase » (C-GT).

Harris va vérifier cette hypothèse que la phrase-noyau contient l'i


nformation et les restrictions de co-occurrences; il tente de « rétablir »
l'information d'un texte sur lequel il n'a aucune connaissance par ailleurs,
c'est-à-dire un texte scientifique (TLRI) dont voici la traduction approxi
mative :
« La puissance rotatoire optique des protéines est très sensible
aux conditions expérimentales dans lesquelles elle est mesurée, en
particulier à la longueur d'onde de la lumière utilisée. »

Comme pour l'identification et le classement des phonèmes et des


morphèmes, Harris détermine les transformations et extrait les phrases-
noyaux uniquement à partir des positions de mots et non des significations :
étant donné la description structurale des constructions, par exemple :
La puissance rotatoire = NA;La puissance des protéines = N de N, etc., et
étant donné que l'on appelle transformées deux constructions contenant les
mêmes n classes de mots (avec des additions éventuelles) et satisfaites par la
même liste de n-tuples des membres de ces classes, on aboutit à des phrases-
noyaux, par exemple :
NA = N est A (la puissance est rotatoire),
N1 de N2 = N2 avoir N1 (les protéines ont une puissance), etc.
Étant donné qu'une phrase est réductible en ses constructions-noyaux,
et que celles-ci comportent la même information que l'originale, on peut
rétablir l'information en simplifiant les formes linguistiques : la puissance
est rotatoire /la rotation est optique/les protéines ont une puissance /la puis
sance est très sensible aux conditions /les conditions sont expérimentales /la
puissance est mesurée sous les conditions /la puissance est très sensible à
la longueur d'onde/la lumière a une longueur d'onde/la lumière est utilisée.

II-3. Le système transformationnel.

Ainsi, on peut dire qu'à ce moment de la réflexion de Harris, la trans


formation sur le plan de l'information, n'est qu'un déplacement de redon
dance, c'est-à-dire que les modifications qu'elle appporte sont stylistiques,
emphatiques, ou relèvent de certains types de discours : par exemple le
passif est plus utilisé dans un discours scientifique que dans un discours
courant. Sur le plan syntaxique, la transformation est un déplacement de
constantes, c'est-à-dire d'éléments grammaticaux non porteurs d'informa
tion objective. Or, les constantes sont en nombre fini, et donc descriptibles.
Dans un deuxième moment, on constate le glissement dans la théorie
38

de Harris vers une appréhension différente de la phrase. La première ana


lyse triait les différentes possibilités de phrases d'après une définition des
co-occurrences des éléments qui les constituent. La seconde analyse consiste
à examiner la phrase constituée en tant que « tout », dont la trace éventuelle
est un indicateur quant à la structure profonde, globale elle aussi.
II. 3.1. La trace.
Ce qui laisse supposer qu'il y a un système des transformations, c'est-
à-dire des relations entre les différentes opérations possibles sur une phrase
donnée, c'est que lorsqu'une transformation a opéré sur telle ou telle phrase,
elle laisse une trace, une marque physique sur cette phrase. Or, un certain
nombre de transformations ont des traces en commun; par exemple :
II écrit > c'est un écrivain
Pierre est un gros mangeur > Pierre, c'est un gros mangeur
Pierre mange du melon > c'est du melon que mange Pierre
Pierre mange du melon > c'est Pierre qui mange du melon
Autrement dit, pour quatre transformations différentes, t1, t2, t3, t4,
on remarque en t1 une trace x semblable à une trace de t2, t3, t4. Certes, à
chaque fois, x apparaît simultanément à des changements différents; c'est-
à-dire qu'en t1 il est solidaire d'un changement global différent du change
mentglobal en t2, t3, t4, de même pour chacune de ces trois dernières trans
formations. Mais cette similitude laisse supposer qu'une transformation
donnée est le produit d'un certain nombre d'événements dont chacun est
une transformation élémentaire. Donner le système des transformations, ce
sera donc décrire :
un ensemble de transformations 9 qui opèrent sur les structures
de phrases élémentaires K, donnant 9 K, et qui opèrent également sur
Ф K, de telle façon que chaque 9 ç... ф К est une structure de phrase
possible (si les constantes requises par 9 trouvent l'environnement
qui permet leur occurrence), et que chaque phrase actualisée satis
faità l'une de ces 9 9... 9 К (ТЕ).
II. 3.2. Les transformations élémentaires.
Si donc, on essaie de regrouper en types les différentes transformations,
on a les quatre types suivants :
Les transformations qui, du point de vue quantitatif, n'ajoutent rien
à la phrase initiale, par exemple :
— la permutation : les semaines passent /passent les semaines.
— la transformation « pléonastique » : il étudie la leçon /il étudie sa
leçon.
Les transformations qui augmentent la phrase initiale, sans que chacune
des parties de cette phrase change de statut grammatical, par exemple :
— l'insertion d'un adverbe primitif : elle est jolie/elle est très jolie.
— les extractions : Pierre mange du melon/c'est du melon que mange
Pierre;
— les connecteurs : Je suis contente Jean vient, /Je suis contente si Jean
vient.
Les transformations qui affectent le statut grammatical de la phrase
initiale ou de l'une de ses parties, par exemple :
— la verbalisation : elle devient laide/elle enlaidit,
elle fait des rêves (elle rêve;
— les opérations « miroirs » : son fort, c'est le français /le français, c'est
son fort;
— les opérateurs de phrase : il vient/ je sais qu'il vient.
39

Les transformations qui réduisent une phrase donnée ou une résultante


par l'effacement de mots ou de constantes :
— t2-4-3 : tous les gens dans la salle s' esclaffèrent /toute la salle s'esclaffa.
— Pierre qui est un imbécile /Pierre, un imbécile.
On peut restreindre cette enumeration en comparant les transformat
ions les unes avec les autres de façon plus précise; par exemple, un certain
nombre d'augmentations ne sont que des sous-classes des opérateurs de
phrase : Je sais quelque chose; Jean vient /Je sais que Jean vient.
Jean vient; quelque chose me surprend/La venue de Jean me surprend.
Ainsi, dans cet exemple, la nominalisation, déformation subie par
l'opérande 10, est solidaire de l'opérateur de phrase. De même, la pronomi-
nalisation est une sous-classe de la classe des connecteurs; le pronom et le
connecteur ont en commun le fait d'être une transformation binaire :
P1 Pron P2, et le fait de ne pas admettre un certain nombre d'autres
С
transformations, par exemple la nominalisation de P1 ou P2 : soit :
P1 : J'aime Pierre.
P2 : Pierre lit beaucoup.
P1 Pron P2 = J'aime Pierre qui lit beaucoup.
P1 С P2 = J'aime Pierre parce que Pierre lit beaucoup.
*Mon amour de Pierre qui lit beaucoup.
*Mon amour de Pierre parce que Pierre lit beaucoup.
* J'aime Pierre qui sa lecture abondante.
* J'aime Pierre parce que sa lecture abondante.
En revanche, l'insertion d'un adverbe primitif ne peut se ramener à
aucun autre type de transformation.
II. 3.3. Ébauche d'un système de transformations.
D'après ce que l'on vient de dire, on peut donc penser au système
suivant :
<pa = transformations qui ajoutent un élément d'une classe donnée à un
autre élément d'une autre classe donnée, de telle façon que l'ensemble
ainsi constitué ait le même statut grammatical que l'élément rece
vant la transformation, par exemple :
cpa sur N : un enfant /un certain enfant;
<pa sur A : bleu /bleuâtre; bleu/très bleu.
<ps = les opérateurs de phrase, qui augmentent l'opérande de telle façon
qu'ils occupent la position de S ou du Çl de la phrase initiale, celle-ci
devenant le sujet ou l'objet de l'opérateur. Par exemple : il vient/je
pense qu'il vient.
Il y aura différents sous-types en fonction d'une déformation éventuelle
subie par l'opérande, par exemple :
9sl : pas de déformation : je sais qu'il vient,
9s2 : changement de t : je préfère qu'il vienne,
9s3 : nominalisation : sa venue me surprend.
9V = les opérateurs de verbes, c'est-à-dire les transformations ajoutant

10. L'opérande est la séquence sur laquelle opère une transformation; la séquence
transformée que l'on obtient est la résultante.
40

aussi quelque chose à la phrase, mais ne pouvant être dérivées de


9S, par exemple :
les « auxiliaires » : il vient/il va venir,
l'adjectivisation : il étudie /il est studieux,
la nominalisation : je travaille/je suis un travailleur, etc.
9e = les connecteurs, c'est-à-dire les opérateurs susceptibles de faire de
deux phrases initiales une seule phrase :
Je suis contente, Jean vient > Je suis contente si Jean vient.
9Z = l'effacement, c'est-à-dire les transformations qui réduisent à zéro
certains éléments déterminés, dans des conditions précises. L'effac
ement n'a lieu, la plupart du temps, qu'après d'autres transformations,
par exemple après 9e :
N1 V1, N2 V1 > N1 V1 et N2 N1 > N1 et N2 V
Jean vient, Marie vient > Jean vient et Marie vient > Jean et
Marie viennent,
ou après 9S :
N1 être t N2 ► N1 qu-Pron-N1 être t N2 > N1, N2
Pierre est un imbécile > Pierre qui est un imbécile > Pierre, un
imbécile.
On peut donc se demander pourquoi inclure 9Z dans les opérateurs de
base. C'est que, d'une part 9Z n'est pas toujours facultatif : il est intrinsèqu
ement lié à certains opérateurs; il devient alors automatique, simultané, et
non, à proprement parler, conséquent à l'autre opérateur. Par exemple,
l'effacement de la deuxième occurrence de N1 est liée à la nominalisation
de V2, après un 9s de type N1 veut que :
N1 veut que N1 V2 t > N1 veut V2-inf
Pierre veut que Pierre lise > Pierre veut lire
D'autre part, 9Z peut apparaître comme un opérateur à part entière,
lié à ses propres déformations morphologiques, dans des cas tels que : Jean
vient/Jean vient-il? /Vient-il? ou bien : Je laisse X, Y, Z... faire un devoir/Je
laisse faire un devoir
Enfin, certaines transformations ne peuvent intervenir qu'après eff
acement, comme 9m (changement morphologique).
9P : les permutations; ces transformations n'augmentent ni ne réduisent
la phrase initiale, et elles n'opèrent que sur des schémas bien déter
minés :
N V > V N (les jours passent /passent les jours)
*NVA > ANV (elle est belle/belle elle est)
On peut noter que cet opérateur a ceci de particulier qu'il est d'autant
plus possible de l'appliquer à une opérande que celle-ci est en fait la résultante
d'une transformation antérieure, ou de transformations antérieures bien
définies : par exemple, après l'insertion d'un PN, d'un Adv, ou de certains
CP2 à P1 :
P1 PN : Je fais cela pour ma mère / pour ma mère je fais cela
P1 Adv : II partit immédiatement / immédiatement il partit
P1 С P2 : Pierre rit parce que je suis contente /
Parce que je suis contente, Pierre rit
9m : changement morphologique; il s'agit de transformations altérant
la forme physique de certains mots lorsque ceux-ci se trouvent dans
des environnements nouveaux : Je veux que je fasse / je veux faire
41

Ici encore, on peut s'interroger sur la possibilité d'englober les opéra


teurs 9m dans les opérateurs de base, puisque la plupart du temps, cette
transformation est la conséquence de transformations antérieures. Mais
en fait, ce qui fait inclure <pm dans les transformations élémentaires, c'est
que d'une part, le changement n'est pas uniquement automatique : Je
cherche une maison qui a des volets verts est différent de : Je cherche une
maison qui ait des volets verts.
D'autre part, étant donné la définition qu'on en a donné, cpm englobe
en fait les effacements (où la forme physique de tel ou tel mot devient
zéro) et toutes les nominalisations, puisque par exemple dans
Je vois l'homme; tu cherches l'homme > Je vois l'homme que tu cherches
on peut dire que la forme physique de homme devient Qu + e et se déplace
alors entre P1 et P2.

II. 3. 4. Extension et analogie.


Même dans un système complet, et non tel simplement que l'on vient
de l'ébaucher, il y a des formes « uniques » dans la langue, c'est-à-dire dans
lesquelles, s'il est possible de reconnaître telle ou telle structure, il est
impossible de repérer le passage de telle ou telle transformation. Par exemp
le,on a deux formes parallèles : J'ai sommeil / je sommeille où la seconde est
dérivée de la première par un opérateur : J'ai sommeil / le sommeil est en
moi I je sommeille.
On a de la même façon en français : J'ai faim, j'ai soif mais le parallélisme
que l'on constate sur la première forme n'existe pas ici.
L'extension d'une transformation consiste à extrapoler l'effet d'une
transformation constatée sur telle sous-classe à une nouvelle sous-classe
sur laquelle elle n'est pas constatée, de façon à se donner la possibilité de
rendre compte de certains phénomènes à l'intérieur du système. La trans
formation ainsi obtenue sera dite analogique.
Étant donné deux ensembles de phrases reliées transformation-
nellement, Sa (X') et <p Sa (X'), qui contiennent les sous-classes X' de
X, et le cas Sa (X") de la même structure de phrase, contenant une
sous-classe X" de X, l'extension analogique donne : <p Sa (X") (TE).
Ainsi, d'après des phrases et leurs transformations telle que Elle fait
la cuisine / elle cuisine. Il fait des rêves / il rêve c'est-à-dire :
N1 V-opt Nv > N1 V»

je dirai que des formes telles que Elle fait le ménage / *Elle ménage. Il fait
des poèmes / *Il poème sont du type : N1 V-opt NM > N1 Vť
où le (V) signifie que l'on opère sur N comme sur un V bien qu'il n'ait pas
de suffixe « verbalisant ».
On voit donc que l'extension d'une transformation, si elle ne constitue
pas une description aussi stricte de la langue que la transformation elle-
même, ne mène pas pour cela à la formation arbitraire de phrases, ni à de
nouvelles paires transformationnelles.
On s'aperçoit de la sorte que des transformations primitivement inven
toriées comme opérateurs de base (1.3.2) sont en fait des opérations ana
logiques; par exemple ce que l'on a appelé la transformation-miroir : Le
français, c'est son fort / Son fort, c'est le français.
D'une part, cette transformation n'a lieu que pour К = N1 être t N2,
et d'autre part, l'ordre ne peut être inversé que si N2 a une insertion parti
culière (ici : c'). C'est-à-dire que ce phénomène est semblable à celui de
l'apparition de l'article défini lorsque le N qui le suit est suivi d'une propo-
42

sition relative par exemple : Une truite est un poisson. * Un poisson est une
truite. Ce poisson est une truite.
De même : Un livre est une chose; un livre est tombé. *Un livre qui est
une chose est tombé. Ce livre qui est une chose est tombé ou : * Une chose qui
est tombée est un livre. Cette chose qui est tombée est un livre.
Par conséquent, on peut dire que la transformation-miroir est analo
gique, et qu'il faut supposer une étape telle que Une truite est quelque chose;
quelque chose est un poisson. Une truite est quelque chose qui est un poisson.
Certes, cette étape n'est pas couramment actualisée dans la langue;
mais précisément le but de l'analogie est de restituer une étape non
constatée.

(1) Toutes les formes de phrase élémentaire sont semblables


dans la mesure où elles consistent toutes en une sous-catégorie de N,
plus une sous-catégorie de V, plus t, plus une structure п déterminée
par la sous-catégorie V.
(2) Toutes les transformations sont d'abord définies sur une (ou
plus) des formes de phrase élémentaire, ou encore sur les résultantes
des transformations définies sur les formes de phrase élémentaire.
(3) La résultante d'une transformation diffère de son opérande
(et donc d'une forme de phrase élémentaire) seulement par certaines
différences limitées : soit il y a simplement une insertion a la droite ou
à la gauche de l'un des symboles de la forme, ou bien les sous-
catégories, domaines des symboles, ont été changées, ou enfin, l'ordre
des symboles n'est plus le même que dans l'une des formes de phrase
élémentaire (TT).

III. Conclusion.

On a donc dans un premier temps un ensemble non ordonné de trans


formations définies en termes de co-occurrences et toutes paraphrastiques,
sans que le terme de paraphrase n'apparaisse. On travaille sur des ensembles
de séquences reconnues comme des phrases, constituées des mêmes occur
rences et dotées d'une même échelle d'acceptabilité. Seules les constantes,
le plus souvent associées à des déplacements ou à des effacements, les
différencient. On prend comme point de départ la séquence ayant le moins
de constantes, c'est-à-dire matériellement la plus simple.
Dans un deuxième moment, Harris réduit la liste des transformations
en constituant un réseau d'opérations définies en termes de traces globales
sur la phrase. Dans cette perspective, si la transformation s'applique à une
séquence donnée, alors cette séquence est une phrase. Le passage de la liste
à la structure implique un ordre des transformations, et des distinctions
plus subtiles parmi les différentes opérations; on aboutit à deux types
d'opérateurs, ayant chacun des caractéristiques descriptibles dans la gram
maire : les opérateurs incrémentiels et les opérateurs paraphrastiques.

You might also like