Dero 1998 Inventaire Du Vocabulaire Et Developpement Des Connaissances Du Cours Preparatoire A La Sixieme de College These de Psychologie Univers

Universit de Haute Bretagne - Rennes 2 Laboratoire de Psychologie Exprimentale
Inventaire du vocabulaire et dveloppement des connaissances du Cours Prparatoire la Sixime de collge
Thse de Doctorat Unique de Psychologie Prsente par Mose DRO
Sous la direction du Professeur Alain LIEURY (Universit Rennes 2) Membres du jury : Professeur Agns FLORIN (Universit de Nantes) Professeur Jean-Pierre ROSSI (Universit Paris Sud)
Fvrier 1998
Site personnel : http://moise.dero.free.fr
Rsum
Le terme de mmoire encyclopdique des connaissances propos par Lieury sarticule autour la mmoire smantique et de la mmoire lexicale. Il rend compte des dizaines de milliers de concepts connus par un individu. Sur le terrain scolaire, une tude longitudinale a t suivie de la 6me la 3me de collge (Lieury, 1991-1996). Cette recherche fait la distinction entre vocabulaire courant et vocabulaire nouveau technique des matires. Elle sappuie sur le nombre de mots recenss manuellement dans les ouvrages scolaires pour ses estimations par QCM des connaissances apprises. Pourtant, une rplication informatise sur linventaire dun des ouvrages a rvl une massive sous estimation du nombre de mots contenus (Dro, 1996). Ce constat nous a incit construire cinq tudes complmentaires sur ce thme du vocabulaire et des connaissances scolaires. Notre premier objectif a t de quantifier nouveau les mots du manuel dhistoire 6me (tude n1). Pour dduire le nombre rel de mots techniques, nous avons construit un nouvel inventaire des mots du primaire comme base du vocabulaire courant scolaire au sortir du CM2 (tude n2). Une exprimentation a rvl un biais de subjectivit intervenu lors du recensement des mots au collge (tude n3). Les mots les plus difficiles auraient t subjectivement classs comme tant des mots techniques. Aussi, beaucoup de mots nouveaux ont t limins tort par rapport aux listes de rfrence du vocabulaire courant dalors. Deux tudes transversales ont valu par QCM les connaissances en vocabulaire au primaire. La premire a mesur les rpertoires lexicaux des lves pour chaque niveau (du CP au CM2), la manire de ltude longitudinale (tude n4). La seconde tude a suivi la progression de lacquisition du vocabulaire dun chantillon de mots extrait de linventaire total du primaire, du CP la 6me de collge (tude n5). Parmi les rsultats, il apparat que 80 % du vocabulaire courant scolaire du primaire est connu par les lves de Sixime.
Remerciements
Je tiens remercier le professeur Alain Lieury pour son coute, sa disponibilit et sa sympathie toute particulire durant ces annes. Je remercie trs cordialement les professeurs Agns Florin et Jean-Pierre Rossi davoir bien voulu accepter dtre membres du jury de cette thse. Bien videmment, cette thse naurait pu tre mene bien sans laccord et laide prcieuse des chefs dtablissements scolaires qui mont ouvert leurs portes. Remerciements donc Michel Gauthier, directeur de lcole publique primaire de Chantepie (35) ainsi qu Jean-Franois Rolland, directeur de lcole prive de Brhan (56). Merci aussi aux enseignants pour mavoir aid dans les tudes menes dans leurs classes. Et bien sr un grand merci aux lves anonymes qui ont t les sujets de ces tudes. Je noublierai pas Paul Durand, principal adjoint du collge des Hautes Ourmes de Rennes, que je salue tout particulirement pour ses conseils sur le terrain scolaire. Sa retraite lui permet sans doute de prparer sa manire une monographie sur la pdagogie A Rennes, je salue mes collgues et amis du laboratoire de Psychologie exprimentale de Rennes o lambiance, avec ses pauses th, a t propice au travail et dintressantes discussions : Virginie, Ingrid, aux Vronique comme ric et Christophe. Merci Stphane Bru pour son aide dans le travail prparatoire des manuels scolaires du primaire, ainsi quau groupe de Licence qui dfricha ces ouvrages. A Bordeaux, je tiens remercier galement la nouvelle quipe qui ma accueilli cette anne pour mon poste dATER : Andr Charles, aux Florence et autres membres de cette sympathique quipe. Enfin, amitis toutes particulires Alexandra, Jean-Sbastien, Pascale et Fabien qui mont encourag et motiv dans ce long travail maintenant achev.
A mes parents et amis
Table des matires
INTRODUCTION ........................................................................................... 11 CHAPITRE 1 LE VOCABULAIRE ............................................................... 14 1. 2. INTRODUCTION ..................................................................................... 15 DE LA LEXICOLOGIE AU X ANALYSES TEXTUELLE S .......................... 17
2.1. LA LEXICOLOGIE .......................................................................................................................................17 2.2. LEXICOGRAPHIE ET DICTIONNAIRES .........................................................................................................18 2.2.1. Historique des dictionnaires ............................................................................................................ 18 2.2.2. Typologie ........................................................................................................................................ 19 2.2.3. Lexicographie et mthodologie ....................................................................................................... 21 2.3. LEXICOMTRIE ET ANALYSES TEXTUELLES...............................................................................................22 2.3.1. Historique ........................................................................................................................................ 22 2.3.2. Loi de Zipf et richesse du vocabulaire ............................................................................................. 24 2.3.3. Les logiciels danalyses textuelles ................................................................................................... 26 2.3.4. Lexicomtrie et inventaire du vocabulaire ...................................................................................... 28
3.
LES INVENTAIRES DE V OCABULAIRE ................................................. 29

3.1. LES VOCABULAIRES BASIQUES DES LANGUES ...........................................................................................29 3.1.1. Les travaux de langue anglaise ........................................................................................................ 30 3.1.2. Les travaux de langue franaise....................................................................................................... 32
a) b) c) d) e) Les premires tudes de Henmon (1924) et de Vander Beke (1935) ................................................................32 Le Vocabulaire fondamental du franais de Dottrens et Massarenti (sans date) .......................................33 Le Franais fondamental de Gougenheim & coll., 1959 ...........................................................................33 Le vocabulaire orthographique de base de Ters, Mayer et Reichenbach (1969) .......................................34 Autres travaux ..................................................................................................................................................35
3.2. LES VOCABULAIRES DESTIMATION DES CONNAISSANCES ........................................................................36 3.2.1. Les travaux de langue anglaise ........................................................................................................ 36
a) b) c) d) e) a) b) Seashore et Eckerson (1940) ............................................................................................................................36 Smith (1941) .....................................................................................................................................................39 Templin (1957) .................................................................................................................................................40 Nagy et Anderson (1984)..................................................................................................................................41 Anglin (1993) ...................................................................................................................................................43 Le rpertoire des connaissances lexicales au primaire de Ehrlich, Bramaud du Boucheron & Florin (1978) .........................................................................................................................................................................47 Le vocabulaire technique du collge franais de la 6me la 3me, de Lieury (1991-1996) ..........................49
3.2.2. Les travaux de langue franaise....................................................................................................... 47
3.3. LMENTS DE CRITIQUES AUX INVENTAIRES ............................................................................................53 3.3.1. La source de lchantillon ............................................................................................................... 53 3.3.2. Dfinir ce quest un mot .................................................................................................................. 56 3.3.3. Dterminer quun mot est connu ..................................................................................................... 57
4.
LA CROISSANCE DU VO C ABULAIRE .................................................... 60
4.1. COMBIEN DE MOTS PAR JOUR ? .................................................................................................................60 4.2. COMMENT SONT APPRIS LES MOTS ? .........................................................................................................62 4.2.1. Apprentissages prscolaires ............................................................................................................. 63 4.2.2. Diffrents modes dapprentissage des mots..................................................................................... 64
a) b) c) Apprentissage par enseignement direct ............................................................................................................65 Apprentissage en contexte ................................................................................................................................67 Dcomposition morphologique ........................................................................................................................70
4.3. LES DIFFRENCES INDIVIDUELLES ............................................................................................................75 4.3.1. Les diffrences entre garons et filles ............................................................................................. 75 4.3.2. Le facteur milieu socio-conomique ......................................................................................... 77 4.3.3. La lecture : un facteur essentiel ....................................................................................................... 78
a) b) Lecture et activits extra-scolaires ...................................................................................................................80 Leffet Mathieu .................................................................................................................................................80
5.
CONCLUSION ......................................................................................... 82
CHAPITRE 2 LA MMOIRE ....................................................................... 85 1. 2. INTRODUCTION ..................................................................................... 86 MMOIRE CO URT TERM E VERSUS MMOIRE L O NG TERME ...... 88
2.1. LA MISE EN VIDENCE DE DEUX TYPES DE STOCKAGE...............................................................................88 2.1.1. Les effets sriels .............................................................................................................................. 88 2.1.2. La technique Brown-Peterson ......................................................................................................... 89 2.1.3. Une preuve neurologique : lamnsie de Korsakoff ........................................................................ 90 2.2. VERS UNE CONCEPTION MODULAIRE DE LA MMOIRE ...............................................................................90 2.2.1. Le modle de Broadbent (1958) ...................................................................................................... 91 2.2.2. Le modle dAtkinson et Shiffrin (1968) ........................................................................................ 92 2.2.3. Le modle de Lieury (1992) ............................................................................................................ 94 2.3. MMOIRE DE TRAVAIL ET MMOIRE FICHIER ............................................................................................95 2.3.1. La mmoire de travail (Baddeley, 1986) ......................................................................................... 95 2.3.2. La mmoire fichier (Lieury, 1992a) ................................................................................................ 97
3.
ORGANISATION ET MMO IRE .............................................................. 99

3.1. ORGANISATION ET ENCODAGE DE LINFORMATION ..................................................................................99 3.1.1. La notion de chunk .......................................................................................................................... 99 3.1.2. La catgorisation ........................................................................................................................... 100 3.1.3. Organisations verbale et image .................................................................................................... 101 3.1.4. Lorganisation subjective .............................................................................................................. 102 3.2. ORGANISATION ET RCUPRATION .........................................................................................................104 3.2.1. Les indices de rcupration ........................................................................................................... 104 3.2.2. Reconnaissance et mmoire pisodique ........................................................................................ 106
4.
LA MMOIRE SMANTIQU E ............................................................... 108

4.1. LES MODLES EN RSEAUX .....................................................................................................................108 4.1.1. Collins & Quillian (1969, 1970) .................................................................................................... 108 4.1.2. Collins & Loftus (1975) ................................................................................................................ 111 4.2. LES MODLES DE COMPARAISON PAR TRAITS .........................................................................................113 4.2.1. Meyer (1970) ................................................................................................................................. 113 4.2.2. Smith, Shoben & Rips (1974)........................................................................................................ 114 4.3. VERS DES MODLISATIONS MIXTES.........................................................................................................116
5.
LA MMOIRE ENCYCLOP DIQUE ...................................................... 117

5.1. DFINITION ET ORIGINE DE CETTE NOTION..............................................................................................117 5.2. CONNAISSANCES ENCYCLOPDIQUES SCOLAIRES ...................................................................................119 5.2.1. Importance du raisonnement et de la mmoire .............................................................................. 119 5.2.2. Le vocabulaire des manuels scolaires ............................................................................................ 120 5.2.3. valuation des connaissances encyclopdiques scolaires.............................................................. 121 5.3. CONNAISSANCES ENCYCLOPDIQUES EXTRA-SCOLAIRES ET NORME DE FRQUENCE ..............................126 5.3.1. Savoirs scolaires et extra-scolaires ................................................................................................ 126 5.3.2. Normes de frquence de 221 catgories ........................................................................................ 128 5.3.3. Appartenance catgorielle et temps de jugement smantique ....................................................... 130 5.4. VERS UNE EXPERTISE DES CONNAISSANCES ............................................................................................131
6.
CONCLUSION ....................................................................................... 134
CHAPITRE 3 INVENTAIRES DU VOCAB ULAIRE DHISTOIRE 6 M E ET DU LEXIQUE DU PRIMAIRE ...................................................................... 135 1. 2. PRLUDE AUX INVENTAI RES ............................................................. 136 NOUVEL INVENTAIRE DU VOCABULAIRE DHISTOI RE EN SIXIME (TUDE 1) ............................................................................................. 140
2.1. CONSIDRATIONS PRATIQUES DES TAPES DU TRAITEMENT INFORMATIQUE ..........................................140 2.2. MTHODOLOGIE EMPLOYE ...................................................................................................................142 2.2.1. Dfinition des entres lexicales ..................................................................................................... 142 2.2.2. Prparatifs au comptage informatis ............................................................................................. 143 2.2.3. Choix du logiciel de comptage des formes .................................................................................... 144 2.2.4. Lemmatisation et rduction du vocabulaire ................................................................................... 146 2.3. DISCUSSION DES RSULTATS ..................................................................................................................147
3.
INVENTAIRE DU VOCABU LAIRE AU P RIMAIRE ( TUDE 2) .............. 151

3.1. 3.2. 3.3. 3.4. CHOIX DES OUVRAGES SCOLAIRES ..........................................................................................................151 TRAITEMENTS DES LIVRES ET MANUELS .................................................................................................153 EXAMEN DE LINVENTAIRE .....................................................................................................................154 VOCABULAIRE TECHNIQUE EN HISTOIRE 6ME ..........................................................................................157
4.
DIFFICULT DU VOCABU LAIRE DHISTOIRE EN 6 M E (TUDE 3) .... 159

4.1. HYPOTHSES SUR LES ERREURS DU RECENSEMENT MANUEL ..................................................................159 4.2. PR-EXPRIENCE (MOTS COURANTS / MOTS TECHNIQUES) ......................................................................161 4.3. EXPRIENCE (DEGRS DE DIFFICULT DU VOCABULAIRE) .......................................................................163 4.3.1. Hypothses .................................................................................................................................... 164 4.3.2. Matriel ......................................................................................................................................... 164 4.3.3. Analyses des rsultats .................................................................................................................... 167 4.3.4. Conclusion ..................................................................................................................................... 172
5.
RVALUATION DES INV ENTAIRES DU COLLGE ........................... 174
CHAPITRE 4 DVELOPPEMENT DES CO NNAISSANCES AU PRIMA IRE .... .......................................................................................................... 177 1. 2. INTRODUCTION ................................................................................... 178 ESTIMATION DES CONNA ISSANCES SCOLAIRES P AR QCM DE NIVEAU (TU DE N4) ........................................................................... 180
2.1. HYPOTHSES ..........................................................................................................................................180 2.2. REMARQUES SUR LA CONSTRUCTION DES QCM .....................................................................................181 2.3. DESCRIPTIF DES EXPRIENCES ................................................................................................................182 2.4. ANALYSE DES RSULTATS ......................................................................................................................184 2.4.1. Cours Prparatoire ......................................................................................................................... 184 2.4.2. Cours lmentaire 1re anne ......................................................................................................... 187 2.4.3. Cours lmentaire 2me anne ..................................................................................................... 189 2.4.4. Cours Moyen 1re anne ................................................................................................................. 191 2.4.5. Cours Moyen 2me anne................................................................................................................ 193 2.5. SYNTHSE DE LTUDE ...........................................................................................................................195
3.
ESTIMATION DES CONNA ISSANCES SCOLAIRES P AR QCM SUR LA TOTALIT DU PRIMAIRE (TUDE N5) .............................................. 199
3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. 3.8. DESCRIPTIF DES EXPRIENCES ................................................................................................................199 COURS PRPARATOIRE ...........................................................................................................................200 COURS LMENTAIRE 1RE ANNE...........................................................................................................202 COURS LMENTAIRE 2ME ANNE ..........................................................................................................203 COURS MOYEN 1RE ANNE .....................................................................................................................204 COURS MOYEN 2ME ANNE ....................................................................................................................206 SIXIME DE COLLGE ..............................................................................................................................207 SYNTHSE DE LTUDE ...........................................................................................................................209
4.
DISCUSSION ......................................................................................... 213
CONCLUSION ............................................................................................. 215 RFRENCES BIBLIOGRA PHIQUES ......................................................... 219 TABLES ET INDEX ..................................................................................... 240 1. 2. 3. TABLE DES FIGURES ........................................................................... 241 TABLE DES TABLEAUX ....................................................................... 243 INDEX DES AUTEURS ET DES NO TIONS ............................................. 245
ANNEXES ....................................................... ERREUR ! SIGNET NON DFINI.
ANNEXE 1 INVENTAIRE COMPLET D U MANUEL DHISTOIRE EN SIXIME .................................................. ERREUR ! SIGNET NON DFINI. ANNEXE 2 R SUM DES INVENTAIRE S DES DIX O UVRAGES D U PRIMAIRE ................................................ ERREUR ! SIGNET NON DFINI. ANNEXE 3 MOTS COMMUNS AU DIX OUVRAGES DU PRIMAIR E ERREUR ! SIGNET NON DFINI. ANNEXE 4 DIFFICULT DU VOCABU LAIRE DHISTOIRE EN SIXIME ERREUR ! SIGNET NON DFINI. ANNEXE 5 MATRIEL DE LTUDE N4 .... ERREUR ! SIGNET NON DFINI. ANNEXE 6 STATISTIQUES DE L T UDE N4 .......... ERREUR ! SIGNET NON DFINI. ANNEXE 7 MATRIEL DE LTUDE N5 .... ERREUR ! SIGNET NON DFINI. ANNEXE 8 STATISTIQUES DE L T UDE N5 .......... ERREUR ! SIGNET NON DFINI.
11
INTRODUCTION
Introduction
12
De nombreuses tudes ont mis en vidence que les connaissances en vocabulaire taient un des meilleurs prdicteurs dune aptitude verbale gnrale, avec une corrlation proche de .80 (Anderson & Freebody, 1981 ; Sternberg & Powell, 1983 ; Jenkins, Stein & Wysocki, 1984). Cette importance du vocabulaire sobserve galement dans la russite scolaire des lves au collge o le vocabulaire vient souvent supplanter les tests de raisonnement (Lieury, 1991). Cest pourquoi, de rcents travaux en Psychologie cognitive de la mmoire, sur linitiative de Lieury (1991-1996) et de ses collaborateurs, ont introduit la notion de mmoire encyclopdique pour rendre compte des dizaines de milliers de mots quapprennent les lves durant leur cursus. Comme Nagy & Anderson (1984), ltude longitudinale du collge franais de Lieury & coll. (1992a, 1992b, 1995a, 1995b) a privilgi lexamen des manuels scolaires comme source de rfrence pour les inventaires du vocabulaire des matires enseignes. Ce travail prliminaire a permis daboutir la mise au point de questionnaires choix multiples qui ont examin chez 200 lves lacquisition des mots techniques des diffrentes disciplines. Ltude de ces mots nouveaux techniques (hors vocabulaire courant) sentend de la Sixime jusqu la Troisime o elle interroge le devenir scolaire lpreuve du Brevet des collges. Ces travaux sont prcieux car ils montrent que, ds la Sixime, possder du vocabulaire est important pour la russite au Brevet. Or, un travail rcent a indiqu que cette tude pouvait souffrir dune sous-estimation massive des inventaires de mots techniques (Dro, 1996). Aussi, avant daborder plus avant cette question, il nous faut rappeler certaines considrations sur le vocabulaire et la mmoire.
Introduction
13
Le premier chapitre de notre document apportera quelques prcisions sur le vocabulaire. Nous verrons quil sagit en effet dun objet dtude commun plusieurs domaines de recherche. Ce faisant, de nombreuses dfinitions, mthodes et moyens dexamen des connaissances des rpertoires lexicaux existent qui rendent complexes des questions comme celle du nombre de mots que possde un individu. Cest pourquoi, nous tenterons de clarifier plusieurs points importants pour lestimation de ltendue des connaissances et leur dveloppement. La mmoire sera abord dans un second chapitre. Nous devrions plutt dire les mmoires car celles-ci sont distinctes de part leurs caractristiques et fonctions respectives. Ce premier dcoupage nous sera utile pour prsenter la mmoire smantique o plusieurs modlisations de celle-ci seront discutes. Ces clairages nous permettrons de cheminer jusqu la notion rcente de mmoire encyclopdique scolaire qui intresse cette thse. Ces questions thoriques tant vues, nous pourrons examiner plus mthodologiquement les critiques que nous avons formules sur les conditions de recensement des inventaires techniques du collge franais. Ce troisime chapitre nous verra prsenter un nouvel inventaire du manuel dhistoire en Sixime ainsi que la ralisation dun lexique des mots courants scolaires au primaire. Ces deux travaux rendront possibles une rvaluation de la taille des inventaires techniques au collge. Nous discuterons galement de la distinction faite entre vocabulaire courant et vocabulaire technique que viendrait complter le degr de difficult des mots. Nous ne saurions terminer cette thse sans aller valuer sur le terrain scolaire le dveloppement du vocabulaire que nous avons recens. Aussi, le quatrime et dernier chapitre sera loccasion de prsenter deux tudes transversales examinant les connaissances en vocabulaire courant des lves. Ces deux recherches complmentaires ont employ des lves depuis le Cours Prparatoire jusqu la Sixime de collge.
14
Chapitre 1 LE VOCABULAIRE
Le vocabulaire
15
Un bon vocabulaire dorthographe doit tre pris dans le vocabulaire des enfants. Lcole doit outiller lenfant pour lui permettre de participer pleinement la vie de son milieu, dtablir et dtendre ses relations sociales. Lui fournir un vocabulaire appropri ses besoins actuels dexpression, en prvoyant dans la mesure du possible les besoins futurs, cest le mettre mme de comprendre ses semblables et de sen faire comprendre. Aristizabal, M. (Frre Gonzalo Carlos, 1938).
1. I NTRODUCTION
De combien de mots dispose la langue franaise ? Combien de mots connat un enfant en Sixime ? Ces simples questions soulvent en fait beaucoup de difficults quune rponse rapide et strictement quantitative risquerait de passer sous silence. De nombreuses tudes montrent que toute langue ou dialecte possde un vocabulaire o les mots se comptent par milliers voire par plusieurs dizaines de milliers (Cuff, 1930 ; Nagy & Anderson, 1984 ; Seashore & Eckerson, 1940, etc.). Pourtant, il est bien dlicat dinventorier ces rpertoires lexicaux et destimer la connaissance en vocabulaire (Flieller, Delesmont & Thibaut, 1992). En effet, parler de vocabulaire ou de lexique, cest matriser la mesure des techniques comptables des mots. Or, selon lappartenance telle ou telle discipline tudiant le vocabulaire (linguistique, psychologie), les chercheurs ont des dfinitions diffrentes pour
Le vocabulaire
16
qualifier un mot de mot . De mme, leurs mthodes dinventaire et dvaluation des connaissances ne sont pas toujours identiques. Aussi, lobjectif de ce chapitre est de donner quelques prcisions sur les problmes de dfinition et de technique rencontres dans ltude du vocabulaire dune langue ou dun individu. Dans un premier temps, nous allons essayer de situer les diffrents travaux traitant du vocabulaire. Pour cela, un rapide historique de leurs origines et mthodes a t dress. Dans un second temps, nous prsenterons les deux types dinventaires existants. Nous le ferons au travers des grandes tudes de langues anglaise et franaise qui distinguent les inventaires de base de ceux destimation des connaissances. Nous aborderons, enfin, comment se font les apprentissages de vocabulaire, notamment sur le versant des acquisitions scolaires.
Le vocabulaire
17
2. D E LA LEXICOLOGIE AUX AN ALYSES TEXTUELL ES

2.1. La lexicologie
La lexicologie se prsente comme ltude de la signification des mots. Par mots , il faut entendre les lexmes et les morphmes dune langue donne, cest--dire les units lexicales dpouilles de leur marquage flexionnel ventuel (Fradin, 1995). Ces units correspondent lensemble des entres figurant la nomenclature dun dictionnaire de langue. Toutefois, la lexicologie ne doit pas tre confondue avec la lexicographie qui concerne gnralement les mthodes de construction des dictionnaires. Son champ dtude pose des questions telles que les units significatives minimales de la langue, la structuration des lexiques, etc. Ces questions indiquent ses emprunts aux modles de disciplines voisines telles que la lexicographie, la linguistique quantitative ou la psychologie cognitive pour ces problmatiques. Des courants qui la traversent, on distingue gnralement quatre approches (classique, structuraliste, par strotype et prototypique). Lapproche classique trouve ses fondements dans les thories aristotliciennes du concept, notamment sous limpulsion de Carnap (1936), philosophe logicien. La dfinition correcte dun concept sous lequel sorganisent les objets du monde rclame que la signification dun item lexical fournisse les conditions ncessaires et suffisantes quun objet ou une situation doivent possder pour tre dsign par cet item. De parent linguistique, lapproche structuraliste des Europens tels que Pottier (1974) ou Baldinger (1984) propose que tous les smes (ou traits smantiques) dune unit lexicale donne soient dtermins par la place quoccupe cette signification (ou smme, qui est lensemble des smes dun mot) dans la structure des autres significations de ce mme champ
Le vocabulaire
18
smantique. La dfinition des smes, qui dpend des oppositions des smmes dans un domaine smantique dfini, est strictement contextuelle et non pas universelle. Dans lapproche par strotype, Putnam (1975) remet en cause la condition ncessaire et suffisante de la signification dun mot. Si certains critres de dfinition dun mot sont inchangeables (les traits centraux), dautres, les strotypes, sont des informations partielles, non vrifies et rvisables attaches au mot. Une perspective est ainsi ouverte selon laquelle les items lexicaux ne sont pas smantiquement tous de la mme sorte. Le dernier courant reprable de la lexicologie, lapproche prototypique, marque sans doute le plus ses emprunts la psychologie cognitive. Ce courant sintresse aux travaux des annes 70 o Rosch, Mervis, Gray, Johnson & Boyes-Braem (1976) notamment montrent que la catgorisation de lapproche classique nest pas dfendable du point de vue psychologique. Cest l quapparaissent les notions de proprit et de typicalit des exemplaires associs une catgorie, notions que nous verrons ultrieurement dans la partie traitant de la mmoire smantique (Cf. page 108).
2.2. Lexicographie et dictionnaires

2.2.1. Historique des dictionnaires
Si les dictionnaires peuvent paratre comme des produits "naturels", sans origine ou sans opacit (Rey, 1977, p 11), bref entrs dans les usages quotidiens, ils sont aujourdhui lobjet dtudes assidues de la part des lexicographes. Une dfinition de la lexicographie prsente les dictionnaires comme tant des rpertoires norms vises didactiques o sont dcrits ou dfinis de manire ordonne des sens et emplois de mots, pour une priode et une langue donnes (Dubois et Dubois, 1971 ; Quemada, 1968 ; Rey, 1977). Ce sont des ouvrages en synchronie des vocabulaires dune poque particulire, la fois tmoins et agents de dmocratisation des connaissances. Aussi, ne sont-ils pas exempts de choix arbitraires. Trs
Le vocabulaire
19
souvent, les dictionnaires sont contingents des idologies, des ralits socioculturelles, conomiques et techniques de leur poque, ainsi que des thories linguistiques y ayant cours. Spcialiste de cette question, Quemada (1968) situe les premiers travaux de lexicographie avec la constitution des glossaires des VIe et VIIe sicles qui listent des recueils de gloses1. Ces premiers glossaires latins du Moyen ge, construits pour faciliter la lecture des textes anciens, vont prendre de limportance. La lexicographie moderne se fonde au XVIe sicle aprs les dbuts de limprimerie occidentale et le dveloppement des premiers rpertoires plurilingues. Premier dictionnaire intgralement monolingue, le Dictionnaire des mots et des choses de Pierre Richelet (1680) est un dictionnaire descriptif n la mme poque que les dbuts des travaux de lAcadmie Franaise de Richelieu (1635).
2.2.2. Typologie
Plusieurs critres permettent de distinguer les dictionnaires. Selon quils traitent dune langue ou de plusieurs, ils sont classs comme dictionnaires monolingues ou plurilingues. Mthodologiquement, la composition et ltendue de la nomenclature dterminent des dictionnaires extensifs ou slectifs, selon quils tendent au recueil du plus grand nombre de mots de la langue2 ou quils se restreignent une fraction du lexique comme les dictionnaires terminologiques. Enfin, la nature des informations fournies les dispose tre des dictionnaires de langue ou encyclopdiques. Chaque ouvrage peut ainsi tre qualifi selon ces trois critres dichotomisants.
1 2
Significations annotes sur les manuscrits pour rendre plus intelligibles les mots Aucun dictionnaire de langue vivante ne peut prtendre tre complet ou jour. De manire utopique, seul le thsaurus dune langue morte pourrait tre exhaustif sil contenait le recensement complet du lexique de tous les documents et textes connus.
Le vocabulaire
20
Dictionnaires de langue et encyclopdiques versus encyclopdies Gnralement, le dictionnaire de langue donne des informations sur la nature et le genre grammatical des mots, leurs formes graphiques et phontiques, leurs sens, leurs emplois ou encore leurs niveaux de langue, mais il ne comporte pas de noms propres. Quant au dictionnaire encyclopdique, outre les informations sur les mots eux-mmes, il contient des dveloppements scientifiques ou historiques sur les choses, les personnes, etc., reprsents par ces mots. Ces descriptions et commentaires peuvent parfois tre dvelopps la manire de petites monographies o arts et sciences sont largement reprsents. Toutefois, le dictionnaire encyclopdique ne doit pas tre confondu avec lencyclopdie alphabtique. Hritire des sommes mdivales, lencyclopdie moderne est une organisation mthodique et hirarchise de notions, de techniques, de disciplines, etc. LEncyclopdie, ou Dictionnaire raisonn des sciences, des arts et des mtiers (1757-1772) de Diderot et de ses 160 collaborateurs en est le modle du genre avec ses 17 tomes. Les dictionnaires historiques Les dictionnaires historiques rassemblent pour partie lvolution diachronique des langues et les tymologies des mots (Mator, 1967). La publication du Dictionnaire de la langue franaise (le Littr ) par E. Littr en 1886, consacr au franais classique de 1600 1800, est le prlude ces projets de dictionnaires historiques des langues. Faisant le pendant au English Oxford Dictionary de J. Murray (1879-1928), le Trsor de la langue franaise des XIXe et XXe sicles (1971-1994), avec des dictionnaires dpoques, est sans doute le premier ouvrage de lexicographie historique tre assist par ordinateur et utiliser la lexicomtrie moderne. Sous la direction de Imbs (1971), de Quemada et Martin, ce vaste ouvrage dispose de 70 millions de contextes fournis par des textes littraires du XIXe et XXe sicles, intgralement analyss, et de 20 millions doccurrences issues de corpus techniques et scientifiques.
Le vocabulaire
21
Les dictionnaires contemporains Les dictionnaires modernes du franais sont dans la tradition du Littr ou du Grand dictionnaire universel du XIXe sicle (1865) en 15 volumes de P. Larousse. Les grands rpertoires tels que le Dictionnaire alphabtique et analogique de la langue franaise de P. Robert (1950) ou le Grand Larousse encyclopdique (1960-1975) dominent une importante production de dictionnaires usuels au format rduit. Ils ont eux-mmes donn naissance des petits dictionnaires. 2.2.3.
Lexicographie et mthodologie
Ces recherches de lexicographie sont largement reprises dans les tudes o les psychologues sintressent aux rpertoires lexicaux ltude de Ehrlich, Bramaud du Boucheron & Florin en 1978 utilise le Dictionnaire du franais contemporain de Dubois & coll., 1971 ou la construction de bases de donnes statistiques du franais. Cest le cas de Brulex, une base de donnes bruxelloise qui possde en effet plus de 35 000 entres extraites du Micro-Robert dans son dition de 1986. Les auteurs de cette base, Content & coll. (1990), y ont repris la plupart des indicateurs de formes et de frquences du Trsor de la langue franaise. Dans le Micro-Robert, issu du Petit Robert qui lui est plus complet, le choix des entres est moins slectif que dans le Dictionnaire du franais contemporain vis--vis des mots drivs et mots composs (Rey, 1977). De telles bases permettent aux psychologues de construire des matriels relativement bien contrls en ce qui concerne les items slectionns (nombre de lettres, frquence lexicale, etc.) Nous lavons vu, les premiers travaux de lexicographie ont cherch collecter et expliciter tous les mots des langues, sans rel principe mthodologique. Cest sous linfluence des sciences du langage du XIXe sicle que la lexicographie se renouvelle avec une approche plus "mthodologique" sinon "scientifique" (Quemada, 1995) des dictionnaires. Pourtant,
Le vocabulaire
22
les mthodes lexicographiques conservent jusquen 1960 un caractre principalement empirique. Les techniques rcentes et la rvolution cyberntique dans son versant informatique vont contribuer ce renouveau scientifique de la lexicographie.
2.3. Lexicomtrie et analyses textuelles

Quelle sappelle statistique lexicale (Guiraud, 1954 ; Muller, 1964 ; Yule, 1944), linguistique statistique (Herdan, 1964) ou statistique textuelle (Lebart & Salem, 1994), la lexicomtrie est ltude quantitative du vocabulaire. Elle regroupe tout un ensemble de mthodes permettant doprer des rorganisations formelles de la squence textuelle et des analyses statistiques portant sur le vocabulaire partir de segmentations (Lebart & Salem, 1988).
2.3.1. Historique
Historiquement, les premiers aspects quantitatifs du langage sont apparus avec les travaux des cryptographes et des stnographes qui tablirent des tables de frquence de lettres. On doit au stnographe Estoup en 1916 (cit. Lebart et Salem, 1994 ; cit. Mandelbrot, 1961) de faire les premires observations connues sur les frquences relatives des mots dans un texte. Pourtant, la pntration de telles mthodes statistiques a t difficile dans le domaine des tudes de textes. On situe les dbuts de la statistique lexicale avec les travaux de Zipf (1935) qui reprend les observations des stnographes et expose le premier modle de distribution thorique du vocabulaire. Ensuite viennent les travaux de Yule en 1944. Certains auteurs vont sinquiter du retard de ces techniques en France, notamment Cohen (1950) ou Guiraud (1954) : ce dernier fait la remarque que la linguistique est la science statistique type : les statisticiens le savent bien, la plupart des linguistes lignorent encore . Cest lui entre autres qui introduit ces mthodes en France et y apporte sa contribution dans deux ouvrages sur le domaine qui prcisent les techniques devenues classiques en la matire
Le vocabulaire
23
(Guiraud, 1973, 1977). Les recherches se dveloppant, elles deviennent plus exigeantes mthodologiquement et plus performantes avec lessor dune informatique adapte (Benzcri, 1979). Les travaux sont ainsi trs varis, allant des recherches sur le thtre classique franais entam par Muller (1964) partir de fichiers mcanographiques aux tudes de Brunet (1981) sur les immenses corpus du Trsor de la langue franaise. Si on carte les recherches sur les frquences, laccroissement et ltendue du lexique, diffrentes approches aux postulats lexicologiques et statistiques divergents apparaissent. Dans le domaine franais, on observe deux courants : le point de vue des lemmatiseurs et celui des non-lemmatiseurs, selon une dsignation de Lebart et Salem (1988) Les Lemmatiseurs Dans cette approche strasbourgeoise de Muller (1968, 1977), les chercheurs tablent sur des mots lemmatiss, dsambiguss et classifis o lunit de comptage y est le vocable (qui ne distingue pas les homographes) ou type chez Herdan (1964). Ce courant rejoint le point de vue lexicographique o lon se donne des rgles didentification permettant de regrouper dans les mmes units les formes graphiques des diffrentes flexions dun mme lemme. Les analyses statistiques utilises ont recours la loi binomiale (tirages alatoires non exhaustifs) et aux comparaisons entre effectifs thoriques calculs et observations faites sur les listes de vocabulaires ou de classes obtenues aprs dpouillement. Ces analyses autorisent la caractrisation des corpus soumis telle que la spcificit dune uvre ou les constantes dun genre, ou encore le style dun auteur. Cette qualification des textes et des auteurs peut parfois clairer certains problmes en littrature tels que les filiations ou les attributions dauteurs ( faux , ditions clandestines, etc.). Les non-lemmatiseurs A lE.N.S. de Saint-Cloud, les auteurs (Geoffroy, Lafon & Tournier, 1974 ; Tournier, 1985 [cit. Lebart et Salem, 1994]) sopposent la lemmatisation et la rduction des formes
Le vocabulaire
24
graphiques des corpus. Ils prfrent une analyse en contexte des textes. De cette manire, ils indiquent la possibilit doprer un retour aux conditions de la production des textes, o les variables psychosociales, repres et choisies lors de la constitution du corpus, seraient analysables. Leur technique est la sparation des formes sous-frquence spcifique des textes et celles les mieux rparties dans le corpus. Les approximations binomiales sont abandonnes au profit de la loi hypergomtrique (tirages exhaustifs des formes) : les formes sont ainsi indices en probabilits pour les analyses des chercheurs. Ce sont ces deux courants qui en France vont prluder la ralisation des programmes dordinateurs actuels en matire danalyse textuelle, dont les procdures sont dtailles plus avant.
2.3.2. Loi de Zipf et richesse du vocabulaire

Comme nous lavons dit, reprenant les constatations dEstoup (1916), Zipf (1935) remarque que toutes les gammes de frquences obtenues partir de textes de corpus homognes de taille suffisante prsentent des caractristiques communes. Il indique que si lon dresse une table de lensemble des mots diffrents dun quelconque texte, classe par ordre de frquences dcroissantes, on observe que la frquence dun mot est inversement proportionnelle son rang dans la liste. Cela signifie que le produit de la frquence dun mot quelconque par son rang est quasiment constant. La formule suivante dtaille ce qui est souvent dsign sous le nom de loi de Zipf : f r = constante ; o f est la frquence dun mot dans un corpus et r son rang dans la liste des
mots classs par frquences dcroissantes. Cette galit3, du moins cette approximation, est indpendante des locuteurs, des types de textes et des langues. Sa reprsentation graphique est donne par un diagramme de Pareto (Cf. Figure 1 ci-aprs) qui synthtise les renseignements
Le vocabulaire
25
contenus dans la gamme des frquences. Ce diagramme est constitu dun ensemble de points tracs dans un repre cartsien o les axes verticaux et horizontaux sont gradus de manire logarithmique : 101, 102, 103 De nombreuses expriences montrent que les points du trac salignent approximativement le long dune ligne droite.
Figure 1
Exemple de reprsentation graphique dun diagramme de Pareto du produit f de la relation de Zipf (1935)
10000
Frquence des rptitions
1000
100
10
1 1 10 100 1000 Rang des formes rptes
En 1961, Mandelbrot prcise la loi de Zipf en lui ajoutant deux paramtres supplmentaires : lun permet de tenir compte de distorsions au voisinage des mots les plus frquents, lautre mesure la richesse du langage. Dautres modles de distribution du vocabulaire vont galement apparatre et dmontrer les caractristiques rgulires des langues telles que la relation entre structure phonique du discours et la frquence des mots : plus un mot est frquent, plus il est court, cest--dire moins son cot de production est lev ; Caron (1989) parle dorganisation optimale du code (maximum dinformation pour un cot moyen minimum) .
Gougenheim, Micha, Rivenc & Sauvageot (1959) donne une formule plus complte de la relation de Zipf : f r = constante ; avec qui est un paramtre caractrisant le corpus.
Le vocabulaire
26
Ces quelques principes sur les frquences des mots peuvent tre rapprochs de phnomnes bien tudis en psychologie que nous allons voquer, sans les traiter de manire exhaustive. Parmi ces phnomnes, celui de lamorage smantique (priming), o laccs un mot se trouve facilit si la prsentation de ce mot est prcde par celle dun autre mot lui tant smantiquement associ (Meyer & Schvaneveldt, 1971). Leffet est maximal lorsque les deux mots sont identiques (pour une revue, cf. Quaireau, 1994). Autre phnomne proche en psychologie, celui liant la frquence dun mot sa rapidit daccs, notamment dans les travaux de Howes et Solomon (1951). Les deux auteurs y remarquent que le seuil didentification dun mot au tachistoscope est dautant plus bas que sa frquence est grande. Ce mme effet a t retrouv par la suite dans des tches trs varies : identification du mot avec un bruit masquant, dcision lexicale, dtection, dnomination De ce phnomne largement vrifi, Caron (1989) indique que plus un mot est frquent plus son accs lexical est rapide .
2.3.3. Les logiciels danalyses textuelles

Lessor de linformatique a bien videmment facilit les longs et rptitifs travaux des analyses textuelles. Cette volution de la lexicomtrie sest faite en direction dune sophistication des traitements et dune macro-statistique de corpus. En France, les logiciels danalyses textuelles ont dabord t le fait de chercheurs de diffrents courants de la lexicomtrie. Ainsi, on doit le logiciel ALCESTE lquipe de Reinert (1987, 1990) au CNRS lUniversit Toulouse-Le Mirail, LEXICO1 de Salem lENS de Saint-Cloud ou le programme SPADT Lebart, Morineau et Bcue (1989), au CISIA. Dveloppes dabord selon des considrations thoriques spcifiques, les versions rcentes des logiciels possdent gnralement les mmes fonctionnalits et modules danalyses lmentaires. Les analyses de donnes textuelles de ces programmes visent dcouvrir linformation essentielle contenue dans un texte. Cette mthodologie en forte progression trouve ses
Le vocabulaire
27
applications dans tous les domaines traitant des squences de textes. Son objectif est de quantifier les structures smantiques les plus fortes. Les recherches ont confirm (Benzcri, 1981) que les structures smantiques sont troitement lies la distribution des mots dans un texte et que la distribution des mots est rarement le fait du hasard. Les fonctionnalits actuelles de ces programmes sont de dcrire, classer, assimiler et synthtiser automatiquement un texte. Les logiciels rcents (ALCESTE, SPHINX LEXICA, SPADT, etc.) permettent ainsi deffectuer de manire automatique lanalyse de questions ouvertes denqutes, dentretiens, de textes littraires, darticles de revues, etc. Toutefois, linformatique impose un certain formatage des donnes de manire ce que lautomaticit des traitements possibles se fasse au mieux. Si les programmes soulagent lvidence le chercheur, ils contraignent nanmoins une certaine formalisation les recherches en ce domaine. De plus, le reprage automatis de la structure smantique des segments analyss, phrases et propositions, nest pas encore ce point abouti que les analyses puissent se faire en labsence du chercheur. La complexit des langues, dans leurs expressions idiomatiques ou mots composs non littraux, nautorise pas encore des traitements entirement automatiss. Mme si la lemmatisation et la dsambigusation en contexte des formes graphiques font des progrs (usage de dictionnaires de formes tablant sur les probabilits dapparition de certaines formes) lautomaticit totale nest pas encore de mise. Comme lindique Ters (1985), le mot du lexique ne peut prendre son sens rel quen contexte. Cest la syntaxe qui dtermine lacception correcte des mots. Si la faiblesse de lapprenti lecteur ou scripteur est dignorer o commencent et sarrtent les
Le vocabulaire
28
mots, celle de lordinateur est quil ne peut tabler, aprs instructions rigides intgres dans ses automatismes, que sur les dlimiteurs4 dclars (Ters, 1985). Toutefois, des progrs importants sont en vue du ct des analyseurs lexicaux ou morphosyntaxiques. Les pistes sorientent vers la mythique traduction automatique (G.E.T.A Grenoble), les statistiques grammaticales (inities par Gross & Lentin, 1964) ou encore sur les tudes autour de gigantesques banques de textes comme celle de lInstitut de la langue franaise de Nancy pour le Trsor de la langue franaise avec quelques 150 millions de mots.
2.3.4. Lexicomtrie et inventaire du vocabulaire

La sophistication des procdures est grande et le dveloppement des mthodologies danalyses textuelles constant. Cependant, il ne faut pas perdre de vue que, dans ce travail de thse, seule une faible partie des travaux en lexicomtrie nous intresse. Nous lavons dit, les lexicomtriciens sattachent dsormais peu la structure des gammes de frquences, ltendue ou la richesse du lexique, tats des premiers travaux de lexicomtrie en la matire. Pourtant, dans le domaine des langues, ces notions de la statistique lexicale permettent dtablir des lexiques de base. Ces lexiques reprsentent la part la plus fondamentale du vocabulaire dune langue et font souvent lobjet denseignement privilgi (franais fondamental, etc.). Cet aspect prcis intresse le chercheur en vocabulaire et motive mthodologiquement une partie de ce travail de thse.
Les dlimiteurs ou sparateurs sont des caractres tels que lespace, la virgule, etc. qui bornent le reprage dun mot. Le mot ou la forme graphique sont donc des chanes de caractres non-dlimiteurs bornes leurs extrmits par des caractres dlimiteurs
Le vocabulaire
29
3. L ES INVENTAIRES DE VOCABULAIRE
Si la question semble apparemment simple de se demander combien de mots connat un individu lambda, la diversit des rponses fournies depuis un sicle dmontre bien la complexit de cette interrogation. Pour tenter dy rpondre nous prsenterons ltat de la question actuelle et son volution depuis ces 80 dernires annes au travers de quelques tudes choisies. Bien quil ait t possible de dresser un inventaire chronologique des tudes en ce domaine, il parait plus judicieux, la manire de Ehrlich et de ses collaborateurs (1978) de dcouper les tudes menes en deux groupes aux objectifs distincts. Le premier axe de recherche reprable tente de dfinir des vocabulaires de base dune langue donne, la manire de Vander Beke (1935). Les tudes de cette parent visent dterminer les termes fondamentaux dune langue, ces termes devant tre appris selon une progression donne. Nous parlerons de vocabulaires basiques pour ces premiers inventaires. Le second axe a pour objectif destimer la dimension des rpertoires lexicaux connus par les sujets, comme lont fait Seashore & Eckerson (1940) et bien dautres. Ici, nous nous attacherons quantifier les termes connus et la nature des connaissances antrieures des sujets. Nous leur donnerons le nom de vocabulaires estimant les connaissances.
3.1. Les vocabulaires basiques des langues

Pourquoi des vocabulaires de base des langues ? Cest dans lInterim Report on vocabulary selection for teaching English as a foreign language de 1936 (aux ditions King & Son Londres) que lon retrouve les principales raisons indiques alors la question de la simplification des langues et spcialement des vocabulaires. Si les intrts thoriques sont nombreux, lun deux ressort : un vocabulaire rduit peut tre destin servir de base de
Le vocabulaire
30
dpart pour lacquisition dun vocabulaire plus tendu. Mais les finalits des confrenciers retranscrites dans ce document de 1936 sont diverses : on envisage autant la ralisation dexamens standardiss, que des guides pour touristes ou encore la possibilit dtablir des listes de mots par ordre dimportance pour lenseignement pratique des langues. Ce dernier point concernant lenseignement est majeur dans la ralisation des vocabulaires basiques o les tudes initiales emploient des matriels textuels.
3.1.1. Les travaux de langue anglaise

Commenons dabord brivement par les recherches sur le vocabulaire dadultes. La premire publication scientifique est celle de Andersen, en 1917, suivie par beaucoup dautres. Le Tableau 1 ci-dessous prsente les tudes majeures du dbut du sicle pour le vocabulaire des adultes. On constate que si les sources textuelles utilises sont proches (principalement des correspondances) elles diffrent selon les auteurs quant la quantit de mots relevs.
Tableau 1
Quelques tudes de langue anglaise de vocabulaire basique dadultes (daprs Dottrens et Massarenti, 1963)
tendue de la recherche (en mots) 361 184 17 701 28 292 67 581 200 000 436 233 Mots diffrents 1 223 1 869 3 360 2 623 5 088 19 243
Date 1917 1917 1921 1923 1924 1926
Auteurs Andersen Houser, J. D. Clarke, F. V. Horn Crowder Horn
Sources 3 723 lettres (33 mtiers diffrents) 750 lettres de fermiers 2 000 lettres adresses un journal 1 125 lettres de banquiers 2 258 lettres daffaires Correspondance
Cest surtout Odgen et Richards, logiciens de formation, que lon doit llaboration du Basic English de 1920 1928. Sintressant la question dune langue universelle sur la
Le vocabulaire
31
base de langlais il vont construire une liste de 850 mots, liste notamment rutilise en 1933 lcole navale du Japon. La vritable diffusion du Basic English se fait durant la seconde guerre mondiale o il est massivement enseign en Chine, en Inde, en Australie ou aux USA. Historiquement plus prcoces de quelques annes par rapport aux vocabulaires dadultes, les recherches sur le vocabulaire de base des enfants dbutent pour langlais avec ltude de J. H. Smith, en 1913. La premire liste dun vocabulaire simplifi est toutefois luvre de Jones cette mme anne qui tablit les premiers 4 532 mots dun lexique de base aprs avoir trait plus de 15 millions de mots provenant de rdactions dlves. Le Tableau 2 ci-dessous dresse un rapide panorama de ces tudes et publications en langue anglaise. Ici, lessentiel des travaux porte sur des productions crites scolaires des enfants.
Tableau 2
Quelques tudes de langue anglaise de vocabulaire basique dlves (daprs Dottrens et Massarenti, 1963)
Date 1913 1913 1916 1916 1921 1926 1926 1929 1931
Auteurs Smith, J. H. Jones Bauer Comit de Kansas Tidyman Wilmarth Breed Lorenz Fitzgerald
Sources Rdactions denfants
tendue de la recherche (en mots) 75 000
Mots diffrents 1 100 19 000 4 448 3 850 5 184 7 035 2 915 7 340
Liste propose 4 532 3 037 3 000 4 600
7 500 rdactions de 1 050 15 000 000 lves 18 000 rdactions 2 500 000 49 000 rdactions de 16 000 lves 5 000 rdactions parmi 15 000 copies 1 040 rdactions 3 505 lettres crites hors de lcole 538 500 123 235 18 000 000 82 694 470 046
Bien que les travaux de langue anglaise soient nombreux en la matire et les premiers historiquement, je prfre prsenter plus particulirement ceux de langue franaise afin dclairer les discussions sur ces matriels.
Le vocabulaire
32
3.1.2. Les travaux de langue franaise

a ) Les premires tudes de Henmon (1924) et de Vander Beke (1935)
Si on observe maintenant les travaux portant sur le franais et plus particulirement sur le vocabulaire enfantin, il faut remonter Henmon, professeur amricain, qui en 1924 publie les premires donnes statistiques sur le vocabulaire contenu dans les livres de lecture franais. A lorigine, rapportent Gougenheim et ses collaborateurs (1959), Henmon constate que les ouvrages pour les dbutants en franais ne saccordent pas sur le vocabulaire. Il dcide dtablir scientifiquement un dcompte des mots les plus usuels du franais et den dterminer leur frquence. Sa liste comporte 3 900 mots franais. Le travail de Henmon a t si rigoureux que Ters (1985) en indique que, jusque dans les annes 70 et lavnement du comptage informatis, les chercheurs ont jug inutile de recompter la liste des 69 mots-outils5 (ou mots fonctionnels, Caron, 1989) quHenmon dnombre comme structurant la phrase franaise ( , ce, de, elle, en... ). Un peu plus tard, de 1926 1927, Vander Beke collaborant avec Henmon poursuit et amliore ce travail. Sur les 6 067 mots diffrents puiss dans 88 sources varies, il ne retient quune liste de base de 2 069 mots. Ce travail est rcapitul par lauteur sous le titre de A French word book en 1929. Toutefois, la critique courante au travail de Vander Beke le prsente comme tant un vocabulaire par trop littraire. Il est mme qualifi de vocabulaire dun autre sicle par Gougenheim & coll. (1959).
Linventaire des 69 mots-outils de Henmon (1924) couvre 45 60 % de toutes les occurrences du discours.
Le vocabulaire
33
b )
Le Vocabulaire fondamental du franais de Dottrens et Massarenti (sans date)
Le vocabulaire de Dottrens et Massarenti dont les premires parutions ne sont hlas pas dates porte sur un recensement de mots provenant de productions crites (Cf. toutefois la parution de 1963 de Dottrens et Massarenti). Cest un vocabulaire mixte , cest--dire emprunt au vocabulaire des lves et celui des adultes. Les auteurs se sont bass sur dautres travaux de langue franaise. Ils rutilisent ainsi les tudes de Prescott (1923) sur le Vocabulaire des enfants genevois, ceux de Aristizabal (Frre Gonzalo Carlos, 1938), de Dubois (chelle dorthographe visuelle, en 1939), dHaygood (du mme nom de Vocabulaire fondamental du franais, en 1936) et de Dottrens en 1946 pour constituer leur inventaire dot dun classement de la difficult des mots. Ainsi, comparant finement de prcdentes enqutes, ils ont tabli les mots communs entre les diffrents auteurs en ne tenant compte que de la difficult orthographique des mots. Les auteurs considrent que les 2 716 mots recenss sont le vocabulaire minimal usuel de llve au sortir de lcole primaire. Ici, il nest pas tenu compte des mots-outils que les enfants connaissent dj bien. c ) Le Franais fondamental de Gougenheim & coll., 1959
En 1951, le Ministre de lducation Nationale a command ltablissement dun franais rduit, simplifi. Gougenheim se vit confier un centre dtude sur cette question. Un premier travail fut publi sous les termes du franais lmentaire en 1954 puis remani quelques annes plus tard. Les moyens modernes tel que le magntophone ont permis Gougenheim, Micha, Rivenc & Sauvageot de sintresser non plus aux seuls textes crits mais la l angue dans sa forme parle ds les annes 50. Les membres de ce centre dtude ont procd lenregistrement de conversations et dinterviews de 275 adultes de divers horizons
Le vocabulaire
34
gographiques et culturels franais. Les discours enregistrs portent sur diffrents thmes tels que la profession, les voyages, la sant, la famille et les amis, la vie quotidienne et bien dautres encore. Sur les 312 135 mots du corpus initial, seuls apparaissent 7 995 mots distincts. La publication le Franais Fondamental na prsent que les mots les plus frquents ( 20) donnant un total de 1 063 mots. Dans cette liste, par ordre de frquence, apparaissent les mots grammaticaux, les verbes et les adjectifs, puis les noms. Mais la frquence est un indice trs relatif, en effet certains mots usuels sont ainsi plus ou moins frquemment utiliss selon les milieux socioculturels o a t effectue lenqute. Cette premire constatation sur les frquences amne Gougenheim et ses collaborateurs distinguer mots frquents et mots disponibles. Une tude ultrieure mene chez 914 coliers de 9 12 ans et interrogeant 16 diffrents centres dintrt (le corps, la maison, etc.) conduit lestimation du degr de disponibilit. Ainsi, le rpertoire dfini comme tant le dictionnaire fondamental de la langue franaise est compos de 1 465 mots. Il recense, dans lordre, 692 noms communs, 339 verbes, 253 mots grammaticaux, 98 adjectifs et 83 adverbes. Ce rpertoire est construit partir de la liste des mots qui varient selon leur frquence dusage et partir de celle des mots de ltude de disponibilit. Plusieurs autres recherches vont sinspirer de celles de Gougenheim. Parmi celles-ci, le travail de Ters, Mayer et Reichenbach qui ralisent en 1969 le vocabulaire orthographique de base du franais. d ) Le vocabulaire orthographique de base de Ters, Mayer et Reichenbach (1969)
A partir de neuf vocabulaires ou dictionnaires dj raliss (dont le franais fondamental et le dictionnaire fondamental de la langue franais de Gougenheim & coll.), les trois auteurs crent leur vocabulaire de base. Pour ce faire, ils procdent un relev
Le vocabulaire
35
lexicologique complet des mots o la frquence de chaque terme et sa dispersion parmi les neuf sources incluses sont contrles. Des vocabulaires de rfrence, sont ainsi retenus 7 961 mots prsents dans au moins cinq des ouvrages et dont la frquence minimale est de 10. Cette liste constitue la base fondamentale du franais orthographique des auteurs. e ) Autres travaux
Ehrlich & coll. (1978) citent deux autres recherches sur les lexiques basiques. Le premier, celui de Gallison (1971), est intitul Inventaire thmatique et syntagmatique du franais fondamental. Lauteur tente de faciliter lusage du franais fondamental en oprant des classements syntagmatiques et notionnels des mots du franais. Le second inventaire, celui de Mackey (1971), se veut le Vocabulaire disponible du franais. En comparant les vocabulaires acadien et mtropolitain, daprs les 16 centres dintrts de ltude de Gougenheim, on observe certaines disparits dune liste lautre du degr de disponibilit des mots. De plus, certains mots acadiens napparaissent pas dans le franais mtropolitain et rciproquement. Le Tableau 3 liste les principaux inventaires basiques que nous venons de voir. Tableau 3 Principales tudes de langue franaise de vocabulaire basique des lves
tendue de la recherche (en mots) 400 000 Mots diffrents Liste propose 5 000
Date 1924
Auteurs Henmon
Sources Littrature franaise depuis 1850 : contes, romans populaires, posie, etc. 88 sources varies 5 525 textes : 1 400 lettres dadultes 4 100 rdactions dlves Listes de Prescott, Aristizabal, Dubois, Haygood et Dottrens 275 enregistrements dadultes 9 dictionnaires dont le dictionnaire fondamental de la langue franais de Gougenheim & coll. (1959)
1929 1938
Vander Beke Aristizabal (frre Gonzalo Carlos) Dottrens & Massarenti Gougenheim Ters, Mayer, Reichenbach
1 147 748 460 727
12 038
2 069 3 603
Sans date 1959 1969
312 135
7 995
2 716 1 465 7 961
Le vocabulaire
36
3.2. Les vocabulaires destimation des connaissances

Comme indiqu, le second axe des travaux en matire dinventaire de vocabulaire est centr sur lestimation de la taille des rpertoires lexicaux connus par les individus. L encore, les recherches sont marques par une grande diversit dans lestimation de cette dimension des lexiques. Quand Terman estime 3 600 mots le vocabulaire moyen dun enfant de 8 ans, Smith (1941) lvalue 44 000 mots. Si pour Seashore & Eckerson (1940) et Hartman (1941) les estimations du lexique des tudiants sont trs vastes (respectivement 155 000 et 215 000 mots), celle de Kirkpatrick (1891) nen inclut que 19 000. Les paragraphes ci-dessous dressent un panorama de ces tudes de grande ampleur sur lestimation des connaissances.
3.2.1. Les travaux de langue anglaise

En 1940, Seashore & Eckerson ont dvelopp le Seashore-Eckerson Recognition Vocabulary Test et utilis celui-ci pour estimer ltendue des connaissances en vocabulaire chez les tudiants (niveaux licence) luniversit. Smith (1941) et Templin (1957) ont adapt ce test pour lutiliser dans les tudes dveloppementales chez les enfants scolariss. Les rsultats de ces tudes sont encore discuts dans la littrature rcente. Ils ont t tout particulirement influents dans le guidage des chercheurs actuels et des thoriciens qui concluent que le vocabulaire se dveloppe chez les enfants un taux spectaculaire (Carey, 1978 ; Ehrlich & coll., 1978 ; Lieury & coll., 1992a, 1992b ; Lieury, 1996 ; Nagy & Anderson, 1984 ; Nagy & Herman, 1987). a ) Seashore et Eckerson (1940)
Seashore et Eckerson se sont servis dun grand dictionnaire non abrg de lpoque, le New Standard Dictionary de Funk & Wagnall (1937), qui comporte plus de 450 000 entres. Les ditions rcentes de ce vaste dictionnaire sont encore lheure actuelle considres comme des ouvrages de rfrence. A la manire des mthodes utilises pour les vocabulaires
Le vocabulaire
37
basiques, les auteurs ont analys le New Standard Dictionary duquel ils ont retenu 370 265 entres lexicales. Avec cette premire rduction du dictionnaire, ils ont tabli une dichotomie entre dun ct les mots de base (166 247 mots en caractres gras dans la marge) et de lautre les mots drivatifs (au nombre de 204 018 qui sont des mots en gras relevs lintrieur des dfinitions des entres principales) selon une dfinition large des familles morphologiques. A partir des 166 247 mots de base, ils chantillonnent 1 320 mots rpartis en quatre listes. Ces listes, soumises des tudiants dont la consigne est de les dfinir, permettent aux auteurs de retenir finalement 331 entres principales. 173 de ces entres de base, considres comme mots courants, vont constituer la premire partie du S.E. Test sous lappellation de mots de base gnraux . Les 158 mots restant forment la deuxime partie du test sous la dsignation de mots de base rares . Enfin, la troisime partie comprend 46 sous-entres extraites des mots drivs (Cf. Figure 2). Deux tches diffrentes ont t proposes aux sujets testant les matriels. La premire utilise des questionnaires choix multiples (QCM) o les sujets doivent retrouver les synonymes corrects des items parmi quatre propositions : cette valuation porte sur la partie 1 du S.E. Test. Les parties 2 et 3 quant elles font lobjet dpreuves de dfinitions et de constructions de phrases avec ces items. En multipliant la proportion des entres principales connues par le nombre total des entres principales du dictionnaire, les auteurs ont estim que les lves avaient un vocabulaire de base dun peu moins de 60 000 mots. Selon la mme mthode, ils estiment que leurs sujets ont un vocabulaire de sous-entres, appel vocabulaire drivatif , denviron 95 000 mots. En additionnant les deux estimations ensemble, ils concluent quen moyenne ces tudiants ont un vocabulaire total denviron 155 000 mots. Si les auteurs ne sont pas les premiers chantillonner des mots depuis un aussi grand dictionnaire, ces estimations, avec celles de Hartman (1941), sont parmi les plus grandes jamais rapportes.
Le vocabulaire
38
Figure 2
tapes de construction et de slection des mots du S.E. Test de Seashore et Eckerson (1940), adapt de Ehrlich & coll. (1978)
Slection du vocabulaire
Funk & Wagnall New Standard Dictionary de 450 000 mots 370 265 entres lexicales slectionnes
Distinction mots de base vs mots drivs 166 247 mots de base 1 320 mots diviss en 4 chantillons 204 018 mots drivs
A 331 mots B 331 C 329 D 329
173 mots de base gnraux S.E. Test Partie 1
158 mots de base rares
46 mots drivs
Partie 2
Partie 3
Plusieurs chercheurs (Cf. Colvin, 1951 ; Schulman & Havighurst, 1947 ; Shibles, 1959 ; cit. Anglin, 1993) ont test les connaissances des lves de grade 1 (quivalent au CP en France) laide du S.E. Test, mais seulement deux chercheurs (Smith, 1947 ; Templin, 1957) lont fait avec des enfants de niveaux suprieur au grade 1. De manire critique, Lorge & Chall (1963) ont voulu analyser lquiprobabilit des mots du test, en les vrifiant par rapport aux tables de frquence du Thorndike-Lorge Teachers Word Book de 30 000 mots. Ils notent que les mots les plus frquents sont en fait surreprsents dans le S.E. Test. Leur conclusion est que les scores pouvant tre atteints tant trs grands, lestimation des mots connus est elle-mme trs grande : le S.E. Test, sans doute
Le vocabulaire
39
trop facile pour les mots de frquences leves plus simples dfinir que les autres, est biais car il surestime ltendue des vocabulaires.
b )
Smith (1941)
Dans trois tablissements diffrents, Smith (1941) a test auprs denfants et dadolescents compris entre les grades 1 et 12 les mmes 331 entres principales et 46 sous entres utilises par Seashore et Eckerson. Adaptant les conditions de passations approfondissement des questions et passations orales pour les plus jeunes lves elle estime que les enfants de grade 1 ont un vocabulaire de base moyen denviron 16 900 mots et un vocabulaire total de 23 700 mots. Ses estimations, respectivement pour le vocabulaire de base et le vocabulaire total, sont de 24 000 et 38 000 mots pour les lves de grade 3 (quivalent du CE2) et denviron 28 000 et 43 000 mots au grade 5 (niveau CM2). Pour le grade 12, elle trouve que le vocabulaire de base et celui total ont encore augment avec quelques 47 300 mots de base et 80 300 mots totaux. Elle remarque galement que le pourcentage de sous-entres (ou mots drivatifs) dans le vocabulaire total sest accru tant avec lge quavec le niveau scolaire. Smith a su adapter le S.E. Test ses besoins (temps de passation, consigne de lexaminateur) pour des lves plus gs et a introduit quelques amliorations mthodologiques. Mais elle indique avoir accord partiellement des points si lenfant semblait connatre un item et apport des suggestions certains. Aussi, Templin (1957) et Anglin (1993) critiquent la manire dont les QCM ont t corrigs. Il est suspect des corrections par estimation subjective de certains items et des aides aux rponses des lves durant les passations.
Le vocabulaire
40
c )
Templin (1957)
Templin a rpliqu ltude de Smith avec des enfants de 6, 7 et 8 ans pour les grades 1, 2 et 3. Cependant, si elle na pas utilis des questions diriges ou des allusions indirectes, elle a aussi corrig les QCM en estimant la comprhension de lenfant. Templin calcule que les vocabulaires de base et drivatif augmentent, passant respectivement de 7 800 et 17 600 mots au grade 1 13 000 mots et 28 300 mots au grade 3. Par ailleurs, examinant les variables sexe et milieux socio-conomiques, elle a trouv que l o garons et filles ne diffrent pas significativement, les enfants des strates socio-conomiques les plus faibles connaissent significativement moins de mots que les enfants de strates socio-conomiques plus leves, et ce dans les deux vocabulaires de base et total. La diffrence entre milieux socio-conomiques est de 4 200 mots au grade 1 et de 4 900 au grade 3. Le Tableau 4 suivant dresse rapidement une comparaison vocabulaire de base / vocabulaire total des trois travaux diffrents cits sur la base du S.E. Test.
Tableau 4
Tableau rcapitulatif des estimations de Seashore et Eckerson, Smith et Templin sur la base du S.E. Test
\ Auteurs Seashore & Eckerson Smith (1947) Templin (1957)
Niveaux scolaires grade 1 (6 ans) grade 3 (8 ans) grade 5 (10 ans) grade 12 (17 ans) tudiants
(1940) v. base / v. total 16 900 / 23 700 24 000 / 38 000 28 000 / 43 000 47 300 / 80 300 60 000 / 155 000 7 800 / 13 000 17 600 / 28 300
Le vocabulaire
41
d ) Nagy et Anderson (1984) Leur travail nest pas proprement parler une estimation des connaissances des enfants mais plus une quantification du vocabulaire, sous la forme de familles de mots, que les lves du grade 3 au grade 9 peuvent rencontrer. Pour cela, ils ont recalibr diffrentes estimations, notamment celles de Cuff (1930), Dupuy (1974) et Smith (1941) par la formule suivante (Pour les valeurs de ces estimations originales, confre le Tableau 5, page 46) : R = V ( 1 + ( ( V / N ) ( ( 88 533 / N ) 1 ) ) ) R V est lestimation rvise de la taille absolue du vocabulaire. correspond lestimation originale de lauteur ou des auteurs de la taille absolue du vocabulaire. N est le stock total de mots de la langue reprsent par le dictionnaire ou le corpus utilis par lauteur dorigine. 88 533 est le nombre total de familles de mots distinctes existantes dans langlais scolaire crit de Nagy et Anderson de 1984. Le recalibrage donne quau sortir de la scolarit au grade 12, un lve adulte connat entre 38 500 et 42 700 familles de mots. Mais cette formule met en lumire que la taille du stock de mots utiliss devient un facteur limitatif au fur et mesure que saccrot la taille du vocabulaire personnel : si au grade 3 le recalibrage montre encore une grande diffrence entre les auteurs (de 4 000 23 700 mots connus, cette diffrence des estimations sestompe quasiment au grade 12). Pour quantifier leurs 88 533 familles de mots, ils ont choisi lAmerican heritage word frequency book de Carroll, Davies et Richman (1971). Ce dictionnaire contient 86 741 mots distincts dun corpus de 5 088 721 mots courants provenant de plusieurs milliers de textes publis dans des ouvrages scolaires en usage. Nagy et Anderson le considrent comme langlais scolaire imprim de 8 14 ans. Il est pour eux la base dune dfinition oprationnelle
Le vocabulaire
42
du nombre total de mots de langlais. La mesure dun test de vocabulaire bas sur ce matriel ne pourrait pas tre prise en tant que mesure du vocabulaire oral de lenfant mais pourrait certainement tre approprie en tant que mesure du vocabulaire de lecture de lenfant, indiquent-ils. Parmi les 86 741 mots de leur dictionnaire de rfrence, Nagy et Anderson ont analys plus finement les occurrences dun chantillon alatoire de 7 260 mots do ils ont t les mots rpts (mme sens mais de graphie ou syntaxe diffrente) et les abrviations. Ils ont constitu 121 groupements de 60 mots contigus alphabtiquement partir de la version informatique du dictionnaire en question. La Figure 3 prsente un exemple de reprsentation dune configuration dinterrelation dans un groupe de mots relis ou dune famille de mots. Ici, tous les mots de la famille sont relis au mot anctre add de manire plus ou moins mdiate, certains directement dautres par des mots intermdiaires. Figure 3 Reprsentation graphique de relations entre des mots : exemple de la famille de add (daprs Nagy et Anderson, 1984)
add ADD adds added adding
oil
add-oil addend addends subtraction Addition-subtraction additional
addition
addition ADDITION additions
additive additives Additives
inverse additive-inverse
Le vocabulaire
43
Les deux chercheurs ont formul un systme dchelle en six niveaux de SEM 0 SEM 5 pour qualifier les mots et leurs familles. Cette chelle gradue laisance ou la difficult deviner ou infrer le sens dun mot par rapport son anctre. Au niveau SEM 0, la relation smantique entre le mot cible et son anctre immdiat est transparente alors quau niveau SEM 5 il ny a pas de connexion smantique discernable entre les deux mots. Les mots drivs smantiquement transparents sont compris entre SEM 0 et SEM 2, ceux dits opaques appartiennent aux niveaux SEM 3 - SEM 5. Comptabilisant comme familles de mots distinctes tous les mots morphologiquement de base et les mots drivs smantiquement opaques (SEM 3 SEM 5), les auteurs dnombrent 88 533 mots distincts entre les grades 3 et 9. Au-del du grade 9, ils supposent que le niveau SEM 3 permet la comprhension correcte du sens dun mot driv. Aussi, le nombre de familles distinctes se voit rduit 61 934 par les auteurs. Combien dinterrelations entre les mots de langlais scolaire imprim ? Un premier lment de rponse est donn en terme de taille moyenne dune famille de mots. Sil y a 609 606 formes graphiques diffrentes dans langlais scolaire imprim pour seulement 88 533 familles de mots, on atteint un nombre de 6,88 membres par famille. Mais ce nombre est inexact car plusieurs sortes de mots ne sont pas incluses du tout dans des familles (les nombres et les noms propres par exemple). La relle estimation des auteurs rapporte leur classification en six points donne la valeur moyenne de 4,66 formes distinctes par famille.
e )
Anglin (1993)
Lauteur, la manire de Nagy & Anderson a systmatis lutilisation des familles morphologiques dans ces travaux. Ses tudes, de trs grande ampleur, sappuient sur ldition 1981 du Websters Third New International Dictionary of the English Language, un grand
Le vocabulaire
44
dictionnaire non abrg qui comporte plus de 460 000 entres. Si lobjectif premier dAnglin est de sintresser au dveloppement de lacquisition de la dcomposition morphologique des mots pour en apprendre le sens, son travail est toutefois intressant pour les estimations du vocabulaire auxquelles il aboutit. Lauteur a travaill avec rigueur pour contrler diffrents biais quant la frquence des mots ou la reprsentation des classifications morphologiques (mots racines, mots inflchis, mots drivs, mots composs littraux et idiomes). Sa premire tape a t de vrifier par chantillonnage systmatique le nombre dentres principales diffrentes du Websters Third : toutes les entres principales diminues des homographes et des non-mots (abrviations, prfixes, suffixes et formes combines). Avec 258 601 entres principales diffrentes, Anglin admet que son estimation est du bon ordre de grandeur entre les 240 000 de Dupuy (1974) et les 299 000 entres principales diffrentes estimes en prface du dictionnaire. Ensuite, toutes les deux pages, lauteur a chantillonn un mot toutes les sept entres principales en caractres gras. Il a runi une liste de 1 355 entres principales (1 331 depuis le dictionnaire et 24 des annexes) quil a subdivise en trois pour y liminer les non-mots. Il obtient ainsi trois listes de 434, 433 et 440 mots6 qui sont tudies paralllement par trois quipes. Anglin analyse plus particulirement lchantillon de 434 entres. Dix juges adultes ont rang les 434 mots en fonction de leur difficult. Pour dterminer un ordre final de la liste, du mot le plus simple au plus difficile, un test auprs de 20 enfants a t men sur les mots par ordre de difficult croissante. De ces 434 mots de lchantillon, seuls 157 mots ont t utiliss dans une exprience employant des questionnaires choix multiples : ces items correspondent, selon les juges adultes, des mots que des enfants de 10 ans auraient une chance de connatre.
Ces chantillons sont plus grands que ceux des tudes bases sur le S. E. Test avec 331 items.
Le vocabulaire
45
Lexprience sest droule sur une priode de six mois pendant lanne scolaire. Elle examine les grades 1, 3 et 5 et emploie 96 lves (32 par niveau scolaire) provenant de deux coles diffrentes. Les rpartitions garons / filles et milieux socio-conomiques lev versus faible sont quilibrs dans les groupes. Individuellement, les lves sont vus en situation dentretien. Lexaminateur leur soumet oralement la liste des items, des plus simples aux plus difficiles, aprs une phase de familiarisation avec des mots simples. Il est demand aux jeunes sujets ce que veulent dire chacun des items. En fonction de la qualit de la rponse donne, lexaminateur invite llve complter sa rponse ou lui prsente oralement un QCM sur litem (1 bonne rponse pour 3 distracteurs). Aprs sept checs conscutifs aux items, lentretien est dfinitivement arrt. Les rsultats statistiques indiquent des effets du niveau scolaire et du milieu socioconomique. Les lves connaissent de plus en plus de mots. La progression fait tat dun doublement chaque niveau scolaire tudi. Les estimations montrent quau grade un (CP ) 10 398 mots sont connus. Cette valeur augmente avec une croissance 19 412 mots au grade 3 et 39 994 mots au grade 5. Toutefois, Anglin indique que limportance de ces rsultats sapprcie mieux encore au regard des diffrents types morphologiques des mots en fonction de lge des lves. Aussi, ces indications sur le dveloppement de la connaissance morphologique seront apprcies plus avant dans une partie ad hoc. Pour lheure, le Tableau 5 suivant rsume plusieurs tudes anglophones sur lestimation des connaissances en mots des enfants jusquaux adultes.
Tableau 5
Quelques tudes de langue anglaise sur les estimations de vocabulaire, daprs Cuff (1930), Seashore & Eckerson (1940) et complt
Grade (niveau scolaire)
Adulte 8 4me 9 3me 10 2nde 11 1re 12 Term.
Date Auteurs 1891 Kirkpatrick, 1907 E. A. 1902 Doran, E. W 1917 Gerlach, F. M.
Sources Websters academic dictionary International dictionary Abridged Funk and Wagnalls New Standard dictionary Websters academic dictionary Thorndike Word Book de 1921 Websters shorted school dictionary Funk and Wagnalls New Standard dictionary (1937) Reprise S.E. Test Reprise S.E. Test Websters Third
Entres
(en mots)
Nature des preuves Test de reconnaissance Test de reconnaissance 3/5 QCM 4 choix & 2/5 dfinitions Dfinitions QCM 5 choix Compltion
1 CP
2 CE1 4 480
3 CE2 6 620
4 CM1 7 020
5 CM2 7 860
6 6me
7 5me
28 000 250 000
8 700 10 666 12 000 13 400 15 640 16 020 17 600 20 120 11 634 13 675 17 138 18 865 66 050 21 500 76 250
1918 Brandenburg, C. C. 1926 Sydmonds, P. M. 1930 Cuff, N. B. 1940 Seashore, R. H. & Eckerson, L. 1941 Smith, M. K. 1957 Templin, M. C. 1974 Dupuy, H. P. 1993 Anglin, J. M.
28 000
4 000
5 429
6 887 4 000 5 000
8 207 6 000 6 900
9 613 11 445 12 819 13 504 15 340 13 974 14 975 7 900 10 000 11 250 8 900 10 600 12 100
209 000 450 000
13 200
QCM 4 choix Construction de phrases, QCM et dfinitions idem idem
7 425 10 395 12 460 13 955 14 910 16 800 19 160 20 930 21 245 21 840 155 000
450 000 450 000
23 700 34 000 38 000 45 000 49 000 52 000 55 000 59 000 63 000 68 000 73 000 80 300 13 000 20 000 28 300 2 000 7 800 39 994
Entretien et QCM 10 398
Websters Third (1981) 460 000
19 412
46
Le vocabulaire
47
3.2.2. Les travaux de langue franaise

a ) Le rpertoire des connaissances lexicales au primaire de Ehrlich, Bramaud du Boucheron & Florin (1978)
Concernant les travaux de langue franaise, il faut constater, quen matire dinventaires destimation des connaissances, il existe peu dtudes prcises et de grande ampleur avant les travaux dEhrlich, Bramaud du Boucheron et Florin (1978). Ltude dEhrlich et de ses collaborateurs dbute donc en 1970 et aboutit une publication complte en 1978. Dans cette vaste tude mene par le laboratoire de Psychologie de lUniversit de Poitiers, lobjectif a t de rendre compte de trois points : la dimension du rpertoire lexical des enfants, le contenu smantique de leurs dfinitions des mots et les modifications de leur systme lexical selon le niveau scolaire et le milieu socio-conomique. Louvrage publi en 1978 comprend un dictionnaire gntique des significations de 1 650 entres autorisant le suivi dun ge sur lautre des variations de contenu et dorganisation des connaissances lexicales (Florin, 1993). Les auteurs ont dabord constitu un chantillon extrait dun dictionnaire de rfrence, le Dictionnaire franais contemporain de Dubois & coll. chez Larousse (1971). Le premier critre est la collecte des mots primaires nous dirons les mots de base ou mots racines reprsentatifs des familles smantiques du dictionnaire. Le second critre impose le respect des proportions des diffrentes catgories grammaticales du franais (substantifs, verbes, adjectifs + adverbes). Il a t procd lestimation par des tudiants du degr de connaissance des mots sur une chelle en cinq points de je ne lai jamais entendu je le connais trs bien et je lutilise trs souvent . Les seuls mots retenus sont ceux ayant obtenus des rponses majoritaires de ces juges adultes. Ils constituent un chantillon de rfrence
Le vocabulaire
48
comportant au total 13 500 mots. Un extrait reprsentatif de 2 700 mots est alors soumis des enfants pour deux preuves crites. La premire preuve, le jugement des connaissances, se fait sur la mme chelle en cinq points du degr de connaissance des mots soumis aux juges adultes. Toutefois, les lves ne jugent que 450 mots des 2 700 mots car six chantillons quivalents ont t constitus de manire ce que les passations soient plus aisment ralisables. Quant lpreuve de dfinition, on demande aux lves dcrire tout ce que le mot veut dire . 2 538 enfants en ge de savoir crire, du CE1 au CM2, ont particip ltude. Les auteurs ont contrl les milieux socio-conomiques des lves participants. Au niveau de lexploitation des rsultats, Ehrlich et ses collaborateurs constatent que les rponses des lves sont fortement polarises aux extrmits de lchelle en cinq points. Aussi, ramnent-ils lchelle en cinq points trois degrs de connaissance des mots (CS1 = mots inconnus ; CS3 = les mots moyennement connus, regroupant les chelons 2, 3 et 4 de la prcdente chelle ; CS5 = les mots trs bien connus). En rapportant les rsultats de lpreuve de jugement lchantillon de 13 500 mots, les mots estims moyennement connus par les lves (CS3) sont de 3 026 en CE1 (22,4 %), 3 913 en CE2 (29 %), 5 193 en CM1 (38,5 %) et 6 143 (45,5 %) en CM2. Lanalyse smantique des dfinitions de ltude rend remarquable l'existence d'un dveloppement sensible des connaissances des lves par rapport aux objets, vnements et actions en liens aux mots. Le nombre de jeunes sujets parvenant dfinir les mots crot de manire trs importante, tout autant que la frquence des relations smantiques rencontres dans les dfinitions recueillies. Si avec lge, les capacits de llve rvlent une augmentation de lutilisation de mots dans les dfinitions, les trois chercheurs observent toutefois que dans un certain nombre de dfinitions certaines relations smantiques apparaissent tout particulirement.
Le vocabulaire
49
Si avec lge le rpertoire lexical augmente, les auteurs constatent galement quil est tributaire du milieu socio-conomique dorigine de llve. Un enfant issu dun milieu favoris (cadre, profession librale) possde un stock de mots plus grand quun autre enfant issu dun milieu plus modeste (ouvrier, employ). Cette diffrence socio-conomique demeure pour les quatre annes tudies sans quil y ait deffet dinteraction entre lge et le milieu socio-conomique. Nous reviendrons par la suite sur les effets du milieu socioconomique (Cf. Les diffrences individuelles, page 75).
b )
Le vocabulaire technique du collge franais de la 6me la 3me, de Lieury (1991 -1996)
Pour rendre compte sous langle de la mmoire encyclopdique des acquisitions scolaires conception qui sera dveloppe plus avant dans le chapitre relatif la mmoire Lieury et ses collaborateurs ont tent destimer l'tendue du lexique de connaissances que rencontrent les lves durant leur scolarit. En collaboration avec le collge des Hautes Ourmes (le plus grand collge de Rennes), une tude longitudinale a t mene par lquipe rennaise (Lieury, 1991, 1996 ; Lieury, Van Acker & Durand, 1995a, 1995b ; Lieury, Van Acker, Clvd & Durand, 1992a, 1992b). Le parcours scolaire et lacquisition de mots nouveaux de ces lves ont t tudis sur huit classes (200 lves) de Sixime. Lun des objectifs a t de dnombrer systmatiquement le vocabulaire technique (hors vocabulaire courant) rencontr dans les manuels scolaires, afin de dterminer si lacquisition de ces mots techniques est accessible aux lves, dans les limites de leurs capacits moyennes dacquisition de ces mots. Dans cette tude, il na pas t employ de dictionnaire. Cest sur la base des manuels scolaires utiliss du collge quun inventaire manuel du vocabulaire a t ralis pour chaque anne scolaire et chaque discipline enseigne pour laquelle le collge disposait dun manuel officiel. Pour comptabiliser ces concepts techniques, des manuels de la sixime et de la
Le vocabulaire
50
troisime, Lieury & coll. nont retenu que les mots absents de linventaire basique de Dottrens et Massarenti (dition de 1963). Ce matriel a en effet t choisi comme vocabulaire de rfrence lentre en Sixime. Ds lors, pour le thesaurus rennais, que jappellerai vocabulaire technique du collge franais , le vocabulaire minimal usuel de llve entrant en Sixime est dabord estim aux 2 716 mots du vocabulaire basique de Dottrens et Massarenti. Cependant, Lieury va plus tard considrer que le Dottrens et Massarenti sousestime le vocabulaire courant connu. Cest pourquoi dans les publications rcentes de lauteur (Lieury, 1996) on retrouve une estimation du vocabulaire connu au sortir du CM2 qui se fonde sur les travaux de Ehrlich, Bramaud du Boucheron et Florin de 1978, vocabulaire destimation et non plus basique des mots. Rappelons quau sortir du CM2 un enfant de langue franaise, sur la base de cette recherche, possderait 6 143 mots. Lieury qualifie ces mots de vocabulaire courant par opposition sa conception de vocabulaire technique des disciplines du collge. Dans le Tableau 6, on remarque que le pourcentage de mots techniques se rencontrant en 6me et en 5me est relativement variable selon les disciplines. En histoire, le programme est tel que seul 5 % des mots nouveaux en 6me sont rutiliss en 5me. Pour les mathmatiques, le vocabulaire technique (hors symboles) est faible et on retrouve prs du tiers de ce vocabulaire dune anne sur lautre.
Le vocabulaire
51
Tableau 6
Vocabulaire technique de la 6me et de la 5me (rpartitions par matires et pourcentage de mots communs) daprs Lieury & coll., 1992b
Nombre de mots en Sixime en Cinquime 2 692 2 841 1 816 421 1 370 1 164 776 212 203 9 679 * % de mots communs 13 % 5% 25 % 17 % 12 % 34 % 10 % 15 % 31 % 13 % (1 036 mots)
Franais Histoire Allemand ducation civique Gographie Anglais Biologie Physique Mathmatiques Total
1 989 1 088 891 872 824 716 402 259 167 6 317 *
(* Ces totaux nincluent pas les mots dAllemand, les lves ntudiant quune langue) Faisant suite aux inventaires de vocabulaires, les acquisitions scolaires des lves ont fait l'objet d'une valuation par questionnaires choix multiples. Pour diminuer les erreurs dchantillonnage, Lieury & coll. ont effectu un test de connaissances portant sur un grand chantillon de mots, 100 mots par discipline, ce qui fait un total de 800 QCM par anne. Ainsi, pour le manuel d'histoire en Sixime, 100 mots ont t choisis au hasard parmi les 1 088 mots techniques relevs pour construire ces 100 QCM. Des scores obtenus, le rsultat moyen au QCM indique que les lves de sixime auraient acquis le sens de 2 500 mots sur les 6 300 de linventaire total. A la fin de la cinquime, lestimation moyenne porte 5 000 le nombre de mots acquis en fin danne. Sur ces deux annes, les connaissances en vocabulaire dun lve moyen progressent de 2 500 mots par an. Cependant, la progression nest pas la mme chez tous les enfants. Si le meilleur lve de sixime (dune moyenne gnrale de 17 / 20) a acquis quelques 4 000
Le vocabulaire
52
concepts, ce nest pas le cas de son camarade a yant la moyenne la plus faible (4,5 / 20) qui ne matrise que 1 000 mots, soit une diffrence de 3 000 mots. Les diffrences entre les lves sont donc parfois normes et apparaissent fortement corrles avec les performances scolaires. La Figure 4 suivante rsume les performances des lves sur les quatre annes du collge en matire de connaissance des vocabulaires techniques des disciplines. Elle pose galement le problme de la surcharge des programmes scolaires vis--vis des acquisitions moyennes des lves sur ces annes (Lieury, 1993b). Dans le chapitre La Mmoire , un point relatif aux connaissances encyclopdiques scolaires dtaille cette tude longitudinale (Cf. page 117) en rapprochant capacit de la mmoire encyclopdique et devenir scolaire (russite au Brevet des collges).
Figure 4
Estimation du vocabulaire encyclopdique de la 6me la 3me en fin danne scolaire, daprs Lieury, Van Acker & Durand, 1995b
24000 22000 20000 18000 16000
14000 Estimation 12000 mots acquis 10000 8000 6000 4000 2000 0 base 6me 5me 4me 3me
total manuels Moyenne note la plus leve note la plus basse
Niveau scolaire
Le vocabulaire
53
3.3. lments de critiques aux inventaires

Les paragraphes prcdents ont sans doute alert le lecteur sur un manque dentente substantiel entre les chercheurs vis--vis de la taille absolue des vocabulaires pour un ge donn ou pour un niveau de dveloppement particulier. En effet, nombre dauteurs remarquent que les estimations de vocabulaires varient beaucoup selon les tudes (Entre autres, Anderson & Freebody, 1981 ; Anglin, 1993 ; Graves, 1986 ; Lorge & Chall, 1963 ; Miller, 1978a, 1991 ; Nagy & Anderson, 1984 ; Nagy & Herman, 1987 ; Seashore & Eckerson, 1940). Pour expliquer cette diversit manifeste dans les tudes dune langue donne, les chercheurs invoquent gnralement trois principaux facteurs : le choix de la source dchantillon, la dfinition qualifiant un mot de mot et la manire dont les auteurs estiment quun mot est connu.
3.3.1. La source de lchantillon

Lun des premiers facteurs est donc lchantillon de mots de rfrence. Les tests destins fournir un vocabulaire de taille absolue adoptent gnralement un dictionnaire ou un autre corpus pour reprsenter le stock de mots du langage et valuer la connaissance des sujets dont on pense quils sont un exemple reprsentatif. Aussi, dans nombre dtudes, les chercheurs utilisent gnralement les dictionnaires existants dans lesquels ils chantillonnent des mots. De la quantit dentres du dictionnaire et du volume en items de lchantillon dpendent grandement les estimations qui sont faites. Si lorganisation interne des entres dun dictionnaire reflte des principes linguistiques (synchronie et diachronie des mots), elle tmoigne galement des demandes pratiques de ldition telles que le format des pages. La question des critres de linclusion ou de lexclusion dentres dans louvrage se trouve tout particulirement pose quand on sait que
Le vocabulaire
54
parfois les diteurs liminent des mots ne passant pas dans la mise en page dun dictionnaire. Toutefois, cest principalement sur ltendue des dictionnaires en termes de nombres dentres inclues que plusieurs points sont relever. Plus le nombre de mots dont on part est lev et plus grande est la dimension du rpertoire elle-mme (Hartman, 1941). Si le dictionnaire choisi comporte peu dentres lexicales (par exemple 50 000 entres), le maximum possible destimation sera bien sr le plafond de ce total dentres. Il en va diffremment avec un dictionnaire plus grand qui dpassera le nombre de mots du plus petit dictionnaire. Si un dictionnaire non abrg comporte 250 000 entres et quune personne, quelle que soit la mthode utilise pour estimer sa connaissance, ne connat que 20 % des mots dun chantillon donn, on estimera son savoir 50 000 mots. A linstar de Miller (1978a, 1991), des chercheurs ont suggr que pour viter de sous-estimer la taille des vocabulaires, il est important dutiliser des dictionnaires non abrgs comme le Websters Third new international dictionary of the English language (1981), le Funk and Wagnalls new standard dictionary of the English language (1937) ou le Trsor de la langue franaise (1971-1994, sous la direction de Imbs (1971), Martin et Quemada). De mme, il est observ un autre biais dchantillonnage relatif aux dictionnaires. Plus ils sont grands et plus il y a despace, cest--dire de zone de dfinition, allou aux mots les plus importants. Aussi, lors de lchantillonnage, il existe un risque plus grand de slectionner ces mots ainsi mis en relief (Lorge & Chall, 1963). Williams (1932) confirme cette tendance chantillonner des mots communs en les prenant tous les nimes pages et nimes mots dans la page. Pour remdier cela, il est suggr dnumrer tous les mots et de compter le nombre requis chaque fois.
Le vocabulaire
55
Se pose alors le problme des homographes. Seashore et Eckerson les ont compts en tant quentres principales spares, ce qui a biais leur chantillon en incluant un nombre disproportionn de mots communs (Lorge et Chall, 1963). Il est donc recommand de compter les homographes comme une entre unique. Enfin, Barnett (1974) et Conway (1967) suggrent que pour obtenir un degr raisonnable de confiance dans lestimation faire il faut employer plusieurs chantillons de grandes tailles et les confronter leur dictionnaire dextraction. Face ces divers biais dchantillonnage, plusieurs auteurs ont tent dinclure une vrification de lchantillon de mots par rapport son dictionnaire dorigine. Une premire vrification est de tester lchantillon par rapport la frquence des mots. Dans ses expriences, Anglin (1993) sest aid des considrations de Lorge & Chall (1963) sur la liste utilise par Seashore & Eckerson (1940). Lorge et Chall rapportent en effet que la liste tait biais en faveur des occurrences frquentes ou des mots communs. Ils en dduisent que si un chantillon de mots nest pas biais, le pourcentage de mots dans lchantillon doit tre dans la liste de Thorndike & Lorge (1944) des mots doccurrences les plus frquents du langage, ce pourcentage devant approcher le ratio de mots de Thorndike et Lorge divis par le nombre total de mots du dictionnaire. Cest ce mode de calcul qua utilis Anglin qui ne trouve pas de diffrence significative entre ses trois chantillons et lestimation suppose en utilisant un
2
.
2
Une seconde manire de tester les biais dchantillonnage est de vrifier via un
si la
classification morphologique des mots de lchantillon par rapport au dictionnaire dorigine est conserve.
Le vocabulaire
56
3.3.2. Dfinir ce quest un mot

La dfinition du mot adopt par les chercheurs est un autre important facteur de la varit des estimations des rpertoires lexicaux de vocabulaires. Drum & Koponak (1987) donnent une dfinition basique dun mot dont il est utile de partir. Si un mot est physiquement une configuration acoustique de sons parls ou [] une traduction crite de ces sons , il est assign se rfrer des choses, des vnements ou des ides de manire arbitraire. En effet, il ny a pas de connexion inhrente entre un mot et son rfrent : un arbre pourrait tre appel une maison et vice versa. Quand le mot et son sens rfrentiel se font conventions par une culture, le mot devient la fois un moyen de communiquer des connaissances lintrieur dune culture et la fois un signe des connaissances de lutilisateur de cette culture (Drum & Koponak, 1987). Aussi, en matire dinventaire dun lexique, que ce soit partir de textes ou de productions orales o sont employs des centaines de milliers de mots, les chercheurs conviennent quil faut lemmatiser et rduire les occurrences des vocabulaires. Le vocabulaire estim est fonction de la manire dont les pluriels, les participes et les comparatifs sont compts en tant que des mots racines7 ou des mots diffrents. La plupart des auteurs acceptent avec des diffrences mineures une entre lexicale comme un mot. Cette entre lexicale reprsente une unit tymologique commune o les changements morphologiques sont restreints. Si les diffrences sont grandes,
morphologiquement ou smantiquement, la forme variante est gnralement liste sous lentre principale (ou entre de base) et est compte comme une entre lexicale ou un mot8.
Selon les auteurs, les termes de mots de base ou mots primaires sont galement employs. Aussi, sont-ils utiliss tout autant indiffremment dans ce travail. Lorge & Chall (1963) remarquent que certains dictionnaires et plus particulirement les dictionnaires non abrgs sparent les entres des noms de personnages historiques, de personnages de fiction, noms de Gographie, des noms scientifiques... Considrer ces derniers comme hritage de la langue verbale est discutable.
Le vocabulaire
57
Cest pourquoi, dans lensemble, la rduction des mots bruts de formes flexionnelles ne pose pas de difficult majeure : les formes plurielles sont ramenes au singulier pour les noms et les adjectifs variables, les verbes conjugus linfinitif (Cf. 2.3 - Lexicomtrie et analyses textuelles , p 27). Tels sont les plus petits dnominateurs communs sur lesquels saccordent les chercheurs. Cependant, ds quil sagit de rduire plus avant les termes lemmatiss en mots de base, les critres divergent quand on aborde les formes drivatives des mots. Se pose en effet la question de comment traiter morphologiquement la complexit des vocabulaires. Les recherches actuelles tendent rassembler les mots en terme de familles de mots. Parmi les dfinitions existantes, celle de Nagy & Anderson (1984) reprise par Nagy & Herman (1987) donne une bonne dsignation de cette notion. Cette dfinition prcise quune famille de mots est un ensemble de mots o la relation entre sens et forme est transparente, prdictive . Par exemple en anglais, persecute, persecution et persecutor forment une seule famille avec des flexions rgulires (persecuted, persecutions) tandis que busy et business constituent deux familles distinctes car le sens des mots nest pas prdictible par leurs formes. Cet aspect, nous lavons vu, a conduit Nagy & Anderson (1984) proposer une chelle en six niveaux graduant la difficult infrer le sens dun mot par rapport un autre selon le degr de transparence de leurs significations respectives pour tablir une parent (de SEM 0 SEM 5).
3.3.3. Dterminer quun mot est connu

Finalement, que veut dire connatre un mot ? Cela signifie-t-il que lon connat toutes les significations ou usages dun mot ou au contraire cela veut-il dire ne connatre quun sens ou le sens le plus commun du mot ? A la question du degr de connaissance dun mot, Ehrlich & coll. (1978) notent plusieurs points. Quand un sujet ne parvient pas utiliser en comprhension ou en production
Le vocabulaire
58
un mot dans une phrase, cest que ce mot ne lui est connu quen tant que structure phontique familire dfaut de son sens. A un degr plus lev, si le sujet peut comprendre sans toutefois produire une phrase employant ce mot, cest quil na quune connaissance partielle du sens de litem. Enfin, si le sujet peut utiliser un mot la fois en comprhension et en production, cest quil connat suffisamment la signification de ce mot pour lemployer. Plus mthodologiquement, cest la nature des preuves utilises pour rendre compte de ce niveau de connaissance dun mot par les sujets quil est intressant dexaminer. On rencontre classiquement dans la littrature des rsultats issus dpreuves diffrentes telles que les questionnaires choix multiples, les compltions ou les constructions de phrases, llaboration de dfinition, voire lemploi de synonymes (exemple, Anderson & Freebody, 1981 ; Beck & coll., 1982 ; Ehrlich & coll., 1978 ; Graves, 1986 ; Seashore & Eckerson, 1940). Sil y a corrlation entre diffrentes preuves (Dale, 1956 ; Lorge & Chall, 1963), Flieller et ses collaborateurs (1992), parmi dautres, ont pos la question de lgalit ou non des preuves entre elles concernant la mesure des comptences lexicales. A cette question, ils rpondent sans ambages que les preuves ne sont pas interchangeables. Ils ont en effet compar systmatiquement pour un mme chantillon de mots huit preuves auprs dlves de CM2 et de 5me en combinant trois facteurs dichotomiques : le guidage de la rponse (QCM vs rponses libres), le type dactivit langagire requis dans la tche (activit fonctionnelle vs mtalinguistique) et le type de rponse (une phrase vs un mot). Les rsultats montrent que diffrents instruments dvaluation mobilisent des connaissances smantiques diffrentes et aboutissent des rsultats diffrents. Ils indiquent que les preuves de comprhension (du type QCM) sont beaucoup plus faciles que des preuves de production (rponses libres). Les corrlations entre les preuves lexicales et les preuves telles que la lecture et le raisonnement analogique varient fortement, provenant pour
Le vocabulaire
59
partie de facteurs manipuls dans la tche. Les auteurs remarquent que les preuves mtalinguistiques (synonymies, dfinitions) sont de fait beaucoup plus difficiles que des preuves fonctionnelles (phrases lacunaires ou construction de phrases), le degr dlaboration de la rponse requis modifiant sensiblement les rsultats. La difficult est alors maximale dans une preuve mettant en jeu la fois une activit de production et une activit mtalinguistique. Les auteurs, ainsi que Florin (1993), y soulignent le dcalage en faveur de la comprhension face la production en matire daccs lexical, comme le distingue le modle de Morton (1982). Ils concluent ce que les instruments de mesures des comptences lexicales ne sont donc pas interchangeables et quil y a erreur les prendre pour tels. Un problme supplmentaire pourrait apparatre avec les estimations des vocabulaires chez les enfants prscolaires. La plupart des tests de vocabulaire requirent une capacit prononcer (reconnaissance dans lcrit) les mots (Lorge & Chall, 1963) : aussi on ignore sil sagit dune incapacit prononcer alors que le sens est connu ou dune incapacit prononcer double dune non connaissance de la signification. Le problme se voit heureusement rsolu en administrant oralement les tests. Dans les diffrentes recherches dj prsentes en matire destimation des connaissances, on retrouve ces considrations sur lemploi de diffrentes preuves. Ehrlich et ses collaborateurs (1978) ont en effet eu recours des preuves de dfinitions, destimations par chelles de la connaissance des mots, etc. pour qualifier sur plusieurs dimensions les comptences lexicales des jeunes lves. Quant Anglin (1993), considrant que les jeunes enfants possdent plus de connaissances des mots que de leurs productions de dfinitions nen rvlent, il a systmatis lutilisation dentretien preuves multiples pour dterminer la connaissance ou non dun mot : production orale de dfinition, utilisation de litem dans une phrase et technique des QCM.
Le vocabulaire
60
4. L A CROISSANCE DU VOCABULAIRE
Durant lexistence, toute personne est confronte dinnombrables mots provenant de diverses sources : textes, lectures, amis, parents, mdias et autres. Mme si quelquun apprend en fait peu de mots par rapport ceux rencontrs dans leurs contextes de prsentation, il dveloppe sa vie durant un vocabulaire de dizaines voire de centaines de milliers de mots (Sternberg, 1987). Ces mots reprsentent seulement une partie infime de notre exposition, la vie durant, aux situations de langages (crit et oral). Aussi, si on part du jeune enfant, il est intressant de voir comment se dveloppe ce vocabulaire, la fois dans son tendue et dans sa richesse des concepts.
4.1. Combien de mots par jour ?

Miller (1977, 1978a) ainsi que Carey (1978) ont repris avec intrt ltude de Templin (1957) en convertissant ses estimations en taux approximatif de dveloppement du vocabulaire. Les auteurs notent que les jeunes enfants ont une facilit remarquable apprendre des nouveaux mots. Ceci est reprable dans le nombre moyen de mots appris par jour. Carey estime que pendant leurs six premires annes les enfants de langue anglaise auraient acquis 8 000 racines de mots mais elle prcise que cet apprentissage nest pas rgulier. Elle indique que lapprentissage des mots est minime jusqu lge de 18 mois, avec quelques centaines de mots identifis. Entre 1 an et et 6 ans dge, les enfants apprennent environ 5 mots racines et environ 9 mots nouveaux par jour au total. Pour cet apprentissage des mots chez le jeune enfant, Carey propose de distinguer deux tapes. La premire tape est un processus de fast mapping (cartographie rapide) par lequel un nouveau mot est immdiatement assign une catgorie smantique. Ensuite, cette cartographie rapide est suivie par un processus beaucoup plus lent o des distinctions se font
Le vocabulaire
61
entre les mots de mme catgorie smantique, cette seconde tape sapprenant graduellement. Pour ce processus plus lent, Carey suppose que pendant un intervalle de temps donn lenfant extrait les significations dun grand nombre de mots. Dans une tude innovante employant des noms de couleurs, Carey et Bartlett (Carey, 1978 ; Carey & Bartlett, 1978) introduisent des mots sans significations dans des conversations naturelles chez des enfants de quatre ans en maternelle. Les rsultats obtenus vont dans le sens de ces deux tapes dans lapprentissage des mots. Bartlett et Carey prcisent quil faut cet ge environ six mois pour acqurir le sens plein dun mot nouveau. A raison de 9 mots par jour, lenfant extrairait donc les significations de plus de 1 600 mots en six mois, ce qui serait un indice srieux de lactivit de cartographie rapide. Bien que les ranalyses des donnes de Templin par Carey (1978) montrent un dveloppement remarquable du vocabulaire sur une priode des annes prscolaires au grade 3, les ranalyses de Miller de ces mmes donnes suggrent que le taux de dveloppement du vocabulaire est mme plus rapide entre 6 et 8 ans. En divisant la diffrence entre lestimation moyenne de Templin pour 6 et 8 ans par leur moyenne dge en jours, Miller (1977) a valu quentre 6 et 8 ans un enfant de langue anglaise apprend environ 14 ,5 mots de base sur un total denviron 21 mots par jour. En accord avec Carey (1978), Miller (1977) suggre que le processus dapprentissage dun quelconque mot nest pas complet en un jour et quen fait un enfant va graduellement extraire les sens dun grand nombre de mots durant la mme priode dveloppementale. Il met lhypothse que, dans la majorit des cas, lapprentissage des mots durant les premires annes scolaires est probablement bas sur la capacit de lenfant infrer les significations des mots partir des contextes dans lesquels ils sont entendus. Dans ces travaux sur le taux de dveloppement du vocabulaire pour les annes ultrieures, Miller a continu mettre en relief limportance de lapprentissage contextuel.
Le vocabulaire
62
Pour cela, il sest intress aux annes scolaires o la lecture est en voie de matrise. Il note, comme dautres auteurs, quautour du grade 4 les mots nouveaux sont souvent rencontrs et appris depuis des contextes crits pendant les activits de lecture (Miller, 1988 ; Miller & Gildea, 1987 ; Nagy et Anderson, 1984 ; Nagy, Anderson et Herman, 1987 ; Nagy et Herman, 1987). Les donnes dAnglin (1978, 1993) suggrent aussi une croissance considrable du vocabulaire pendant les annes prscolaires et mme une croissance plus rapide durant les premires annes de scolarit. Cependant, une distinction non releve chez les autres auteurs est donne par Anglin : la distinction entre les mots qui peuvent tre appris sur la base des connaissances morphologiques et les mots qui sont prcdemment appris. Lauteur estime 5,5 le nombre de mots appris par jour entre 1 an et le grade 1. Ce nombre de mot se trouve considrablement augment entre le grade 1 et le grade 3 avec une moyenne de 12 mots par jour. Toutefois la croissance estime est encore plus grande entre le grade 3 et le grade 5 avec une acquisition moyenne value 28 mots par jour, toutes catgories morphologiques confondues (Cf. Tableau 7, page 30).
4.2. Comment sont appris les mots ?

Il existe beaucoup de situations linguistiques o enfants et adultes rencontrent des mots connus et des mots inconnus. On peut citer la participation aux conversations des parents, entre frres et surs, avec des amis ou dautres personnes, lapprentissage partir de leons et de discussion dans la classe dcole, lcoute et lobservation de la tlvision, lcoute de la radio et dautres encore. A lvidence, pour les jeunes enfants, le facteur essentiel dapprentissage des mots nouveaux se fait en contexte oral, lenfant ne connaissant pas lcrit. Cette importance de loral est donc cruciale dans les premiers ges et lcole maternelle (Florin, 1991, 1995). Cest par l en effet que se joue la majorit des situations langagires (coute, conversations)
Le vocabulaire
63
entre enfants et adultes (parents, instituteurs) ou avec dautres enfants (classe, cours d cole). Ces activits langagires permettent dapprendre des mots nouveaux ou de consolider des connaissances de mots dj appris. Voyons dabord le cas plus particulier des apprentissages prscolaires avant daborder de manire gnrale les apprentissages du vocabulaire en lien aux activits scolaires. Ici, les enfants ne savent pas lire, la lecture tant un vecteur important dapprentissage du vocabulaire que nous dvelopperons plus avant.
4.2.1. Apprentissages prscolaires

En moyenne, le premier mot dun enfant apparat vers 10 mois. Son rpertoire lexical saccrot lentement pour atteindre une vingtaine de mots vers 1 an . A partir de cet ge, le vocabulaire stend alors brusquement : dune centaine de mots vers 20 mois, le rpertoire passe prs de 300 mots deux ans et approche les mille mots 3 ans. Comme lindiquent Moreau & Richelle (1984), une estimation quantitative du vocabulaire ces ges ne peut donner quune image imparfaite du dveloppement verbal : les units que lenfant identifie comme des mots du langage sont approximatives par rapport ce quen connat ladulte. Aprs lge de 3 ans, les recherches ont relev que le vocabulaire est appris encore plus rapidement. Lhypothse principale que retiennent les chercheurs est celle de lapprentissage incidentel en contexte plus que de lapprentissage direct des mots. Nous verrons ces deux types dapprentissages un peu plus loin. Les recherches pointent aussi sur le lien entre coute de petites histoires lues aux enfants et dveloppement langagier chez ces derniers (Eller, Pappas & Brown, 1988 ; Elley, 1989 ; Snchal & Cornell, 1993 ; Robbins & Ehri, 1994). Pour cela, les tudes sintressent lextraction chez les jeunes enfants de significations de mots partir dexpositions rptes des vnements qui leur sont lus dans ces ouvrages. Les rsultats donnent deux mises en
Le vocabulaire
64
vidence. Dune part, couter le texte des histoires dans ces livres de lecture permet aux enfants dapprendre incidentellement du vocabulaire. Dautre part, lanalyse des interactions enfants / adultes dans ces activits de lecture voix haute montre que les adultes jouent un rle didactique dans lapprentissage du vocabulaire (Elley, 1989 ; Snchal, 1997). Comme Carey (1978), Snchal (1997) a propos un modle de lacquisition dun mot nouveau. Cinq tapes sont distingues dans son modle. La premire est celle de lencodage et du maintien dune reprsentation phonologique du mot nouveau. Dans un second temps, lenfant extrait des indices contextuels smantiques, syntaxiques et picturaux pour une recherche dans sa mmoire des sens potentiels du mot nouveau. Troisimement, il construit ou slectionne un sens probable appropri. La quatrime tape voit lassociation du sens infr avec la reprsentation phonologique du mot nouveau. Enfin, lenfant intgre et stocke sa nouvelle connaissance avec lancienne (Snchal, Thomas & Monker, 1995).
4.2.2. Diffrents modes dapprentissage des mots

Cette ide dun taux de croissance rapide du vocabulaire pendant les annes prscolaires et suivantes a contribu plusieurs hypothses pour illustrer les contraintes, biais, prdispositions et stratgies qui pourraient aider les enfants dans lapprentissage des mots. Gnralement, trois hypothses sont avances o les principales coles dauteurs se retrouvent : la premire concerne lenseignement direct du vocabulaire aux lves, la deuxime voque des apprentissages en contexte des mots et de leurs sens, et la troisime table sur des stratgies de dcomposition morphologique des mots pour apprendre leurs significations.
Le vocabulaire
65
a )
Apprentissage par enseignement direct
Pour discerner la relation entre vocabulaire et comprhension en lecture, un des moyens dtudes dvelopps a t de construire des situations dentranement au vocabulaire. Dans ce domaine, les recherches les plus cites sont celles de Beck, Perfetti & McKeown (1982) et McKeown, Beck, Omanson & Perfetti (1983). Initialement, Beck, McCaslin et McKeown (1980) ont formul un programme intensif denseignement du vocabulaire dans le but principal daccrotre la comprhension en lecture. Deux autres aspects importants ont t envisags : la prcision de la connaissance des significations dun mot et laccessibilit aux significations dun mot pendant le traitement smantique. Lune des motivations de ce programme provient de lchec inattendu de prcdentes tudes pour produire des accroissements significatifs de la comprhension en lecture via lenseignement du vocabulaire Leur programme implique un apprentissage systmatique de 104 mots de vocabulaire par des expositions rptes ces mots auprs denfants de quartiers dfavoriss. Quatre classes dlves de grade 4 (CE2) quivalentes aux pr-tests ont particip ltude : deux titre de groupe exprimental, deux comme groupe tmoin. Par ailleurs, deux sous ensembles de mots ont t conus : des mots considrs comme rpts peu de fois (entre 10 et 18 fois chacun) versus des mots faisant lobjet de 24 40 rptitions. Les auteurs tentent de savoir si ces rptitions supplmentaires peuvent augmenter lapprentissage. Oprationnellement, tous les mots sont vus dans diffrentes tches au cours du programme. Portant sur les aspects lexicaux et smantiques des 104 items, soixante-quinze leons ont t administres aux lves. Elles se sont droules sur quinze cycles hebdomadaires de cinq sances dune demi-heure chacune. Dans tous les tests raliss en fin danne, les performances du groupe ayant reu un enseignement direct intensif sont trs suprieures celles du groupe contrle. Premirement,
Le vocabulaire
66
ltude de Beck, Perfetti & McKeown (1982) et la rplication de McKeown, Beck, Omanson & Perfetti (1983) mettent en vidence une amlioration en terme de prcision dans les connaissances des significations des mots. Un post-test ces QCM soumis trois semaines plus tard indique que les lves connaissent encore 80 % des items. Deuximement, sur la dimension de laccessibilit aux significations des mots, les temps de raction dune tche de catgorisation smantique dmontrent que les lves du groupe exprimental ont une accessibilit plus rapide aux mots enseigns qu des items non enseigns de manire intensive. Enfin, par rapport aux deux sous-ensembles de mots diffrant par le nombre de rptitions, les enfants apprennent 77,6 % des mots qui sont rpts de 10 18 fois et retiennent 86,5 % de ceux rpts de 24 40 fois : le programme na donc pas t inutilement rptitif. Si seulement 104 mots ont t appris sur une priode de cinq mois, avec une demi-heure dvolue chaque jour cet apprentissage, 208 mots pourraient ainsi tre vus en une anne scolaire. En ne prenant que 10 18 rptitions le programme atteindrait 400 mots annuellement. Nagy & Anderson (1984), tout comme Becker, Dixon & Anderson-Inman (1980), partisans de lenseignement direct du vocabulaire, ont imagin un programme denseignement systmatique dun noyau de 8 000 mots de vocabulaire. Celui-ci prvoit le double de mots en dix ans par rapport McKeown, Beck, Omanson & Perfetti (1983) en passant plus ou moins de temps sur chaque mot. Pour Becker & coll., lautomaticit daccs est la cl de la relation entre connaissance des mots et comprhension de la lecture. Mais, les dfenseurs de lenseignement direct du vocabulaire sappuient sur lhypothse que le nombre de mots distincts de langlais scolaire est petit. Ils pensent, quen elle-mme, la croissance du vocabulaire anne aprs anne est faible et que le nombre de significations de mots connus
Le vocabulaire
67
par un enfant de tout ge est petit. Becker & coll. se fondent en effet sur lestimation de Dupuy (1974) selon laquelle les lycens connaissent environ 7 800 mots. Un autre procd dapprentissage, que nous classerons parmi ceux de lenseignement direct du vocabulaire, est employ par Levin, McCormick, Miller, Berry & Pressley (1982). Ce procd se destine l'apprentissage de vocabulaires spcifiques, se basant sur une mthode de mots clefs pour l'enseignement et lapprentissage du vocabulaire. Si lorigine, la mthode a dabord t dveloppe comme aide lapprentissage du vocabulaire dune deuxime langue (Atkinson, 1975), elle a aussi montr des bnfices comme stratgie pour accrotre le mmorisation de vocabulaire de langue naturelle (Pressley, Levin & McDaniel, 1987). Souvent oppose lapprentissage contextuel que vous allons voir dans le prochain point, la mthode des mots clefs rclame que quelquun connaisse au pralable la signification des mots inconnus qui sont l'objet d'apprentissage. De plus, pour Sternberg (1987), cette mthode par mots clefs manque de spontanit pour les apprenants : lauteur entend par l quil sagit dune mthode dapprentissage moins naturelle que celle par le contexte quil juge centrale dans l'apprentissage quotidien de vocabulaire. Aussi, il semble peu vraisemblable que la majorit des mots rellement appris par les enfants soit le rsultat denseignement direct dans les classes, o gnralement trs peu de temps est allou lenseignement direct du vocabulaire. Bien quintressante sur la matrise et la comprhension de mots de telles tudes dapprentissage intensif de vocabulaire nont pas beaucoup de relations avec les milliers de mots appris par an qui nutilisent pas un tel entranement. b ) Apprentissage en contexte
La seconde hypothse, de loin la plus vhicule dans la littrature, parle donc dapprentissage par le contexte des significations dun mot. Ici, les auteurs cits ne minorent
Le vocabulaire
68
pas le rle de lapprentissage par lcoute mais donnent un rle plus important la lecture dans ce mode dapprentissage par le contexte. Werner & Kaplan (1952) prsentent lapprentissage contextuel comme un argument puissant de nature empirique pouvant expliquer comment les enfants parviennent driver le sens de mots inconnus. Barth (1987) et Sternberg (1987) ont eux aussi insist sur les mcanismes dinfrence pour deviner les mots inconnus. Pensant que l'apprentissage contextuel est central dans l'apprentissage quotidien de vocabulaire, Sternberg fait remarquer quapprendre aux personnes les processus, les indices et les variables de modrations de l'apprentissage contextuel peut aider ces personnes, si elles n'utilisent pas dj spontanment ces aides, l'apprentissage du vocabulaire Reprenant Sternberg & Powell (1983), Sternberg propose une liste de 8 classes dindices contextuels quil identifie dans les textes : des indices temporaux, spatiaux, de valeurs, des descriptifs statiques, des descriptifs fonctionnels, des indices de causalit, catgoriels et dquivalence (synonymie ou antonymie). On retrouve lide de ces diffrents types dindices contextuels dans les tudes rcentes en la matire (Cf. Lieury & Forest, 1994) et notamment celle de Florin (1993) o il est not que les enfants utilisent plusieurs indices de contexte pour interprter le sens de mots nouveaux. Toutefois, dans leurs recherches sur lapprentissage incidentel de vocabulaire partir du contexte, Jenkins, Stein & Wysocki (1984) pensent que lapprentissage contextuel est une hypothse par dfaut et que lapprentissage du sens en contexte est plus difficile dmontrer. Dans une exprience auprs de 112 enfants de grade 5 ils ont observ lapprentissage de 18 mots. Chaque item fait lobjet de plusieurs paragraphes o il est employ avec des synonymes. Les auteurs manipulent le nombre de contexte de prsentation et le niveau des lecteurs. Les rsultats mettent en vidence que les enfants ont appris quelques significations
Le vocabulaire
69
de mots non familiers alors mme quils navaient pas de consigne explicite le faire. Alors que ces effets ont t reprs dans des preuves de dfinitions, ils ne lont pas t de manire sensible dans des tches de compltions de phrases. Cest pourquoi, Jenkins, Stein & Wysocki insistent sur limportance de lapprentissage de vocabulaire-cl dans les activits de comprhension : selon les auteurs, lapprentissage incidentel rclame un trs grand nombre de rptitions des mots, mme quand les lments du contexte sont hautement informatifs. On retrouve ces considrations chez Jenkins et Dixon (1983) qui pour des concepts plus communs prconisent dj 10 rptitions (Cf. Figure 5).
Figure 5
valuation de la comprhension selon la rptition du mme mot dans des contextes pisodiques varis, simplifi daprs Jenkins et Dixon (1983)
100
Pourcentage de rponses correctes (QCM)
80 60 40 20 0 0 2 6 10
Nombres de rptitions
Lieury & Forest (1994) manipulant jusqu huit contextes diffrents par item chez des lves de CM2 (grade 5) indiquent eux aussi la ncessit de beaucoup plus de rptitions de ces contextes ou pisodes de connaissances. Ce nombre de rptitions contextuelles est important pour construire une reprsentation solide du concept cible qui slabore partir des abstractions de nombreux pisodes (Tulving, 1972 ; Schank, 1976 ; Lieury, 1979). Faisant lanalogie aux quarks, les particules lmentaires du physicien dans un modle atomique, Lieury & Forest indiquent que la mmoire
Le vocabulaire
70
smantique du concept [] semble ne se construire quavec la rptition dun nombre relativement important dpisodes contextuels contenant chacun quelques "quarks" de sens . Lhypothse contextuelle de lapprentissage des mots nest pas suffisante elle seule pour expliquer les milliers de mots nouveaux appris annuellement pas les enfants. Dautres auteurs ont propos que lapprentissage du vocabulaire pouvait se faire aussi par des stratgies de dcompositions morphologiques des mots nouveaux pour en infrer le sens. c ) Dcomposition morphologique
En effet, une autre hypothse dveloppementale propose que la croissance considrable des connaissances en vocabulaire observe dans les estimations des auteurs (citons Ehrlich & coll., 1978 ; Nagy & Anderson, 1984 ; Smith, 1941 ; Templin, 1957) pourrait reflter la capacit croissante des enfants sengager dans des rsolutions de problme morphologique. Il est admis que lon peut classer les mots lintrieur de types morphologiques. Lunit danalyse qui est utilise dans ces classifications est le morphme. Un morphme est une unit linguistique de sens minimal (Anglin, 1993) qui contient des parties de sens. Ce sont les plus petits lments individuels de pleine signification dune langue (Aronoff, 1976). Cela peut tre une forme libre, telle que beau, ou une forme dlimite, telle que le -t dans beaut. Le morphme a t utilis comme lunit minimale de lanalyse grammati cale (Bauer, 1983 ; Brown, 1973), mais pour la recherche sur le lexique, comme celle dAnglin, elle peut aussi tre employe comme une unit minimale danalyse smantique. Nous emprunterons Anglin (1993) ses dfinitions pour prsenter les cinq principaux types morphologiques de mots. Lauteur distingue en effet les mots racines, les mots inflchis, les mots drivs, les mots composs littraux et les idiomes. Les mots racines (ou mots primaires ou mots de bases) sont des entres lexicales monomorphmiques qui consistent en lments uniques, les morphmes libres.
Le vocabulaire
71
Les mots inflchis combinent habituellement un morphme libre et un suffixe inflchi. Les suffixes flexionnels modulent gnralement une base grammaticale pour le temps, la personne, le genre et le nombre. Habituellement, sauf irrgularit, ils ne dcoulent pas dun changement dune partie de la langue. Les mots drivs sont des entres lexicales sous la forme dune racine et dun, voire plusieurs, affixes drivs. Cette racine est souvent un mot racine ou un morphme libre (beaut, clairage). Bien que smantiquement lie, laddition daffixes drivs est conue pour donner un mot entirement diffrent de la forme racine. les mots composs littraux (mot mot) sont des entres lexicales se prsentant sous laspect de deux ou plusieurs mots (Bloomfield, 1933). Les mots constituants ces mots composs littraux peuvent tre des mots racines (tire-bouchon) mais lun ou plus dentre eux peuvent tre un mot driv ou un mot inflchi (photocopieur). Un critre supplmentaire utilis pour dfinir ce type de mots est quil est possible de dterminer le sens de lun dentre eux par la connaissance de ses lments morphmiques (Makkai, 1972). Les expressions idiomatiques (idiosyncrasies ou mots composs opaques) sont des entres lexicales ressemblant aux mots composs littraux dans leur forme. Elles comportent deux ou plusieurs mots (avec ou sans affixes drivs ou inflchis). A contrario des mots composs littraux, il nest pas possible den dterminer le sens partir de la connaissance de leurs lments morphmiques (gueule de bois).
Dans ses expriences via entretiens utilisant des preuves de dfinitions, de compltions de phrases et des QCM, Anglin (1993) a bien sr constat que lapprentissage des mots crot entre les niveaux scolaires 1 et 5 considrs. Mais ce dveloppement nest pas le mme en fonction des classes dges constitues et du type morphologique des mots (Cf. Tableau 7 et
Le vocabulaire
72
Figure 6). Lapprentissage qui augmente le plus concerne le vocabulaire des mots drivs, augmentant artificiellement avec lui le total des mots. Dans lensemble, les autres types morphologiques font plus que de doubler sur la priode entre les niveaux scolaires 1 et 5. Cela dmontre un effet manifeste du dveloppement morphologique des mots mais aussi met en vidence que durant la scolarit la croissance du vocabulaire est considrable : si entre 1 an et le grade 1, tous types de mots confondus, la croissance nest que de 5,5 mots/jour, elle passe prs de 28 mots/jour au grade 5. Il est vident que dans les priodes prcoces dacquisition du langage lenfant ne sengage pas dans une analyse morphologique quand il essaie de comprendre les mots : il ne combine pas les morphmes pour crer des mots et tous les mots sont psychologiquement monomorphmiques (Miller, 1991). Ce nest quun peu plus tard que le vocabulaire de lenfant commence inclure les mots avec plus dun morphme, comme les noms marqus du pluriel, les verbes marqus dune flexion (Brown, 1973) ou les mots composs de deux termes. Qui plus est, lvidence suggre que le dveloppement lexical aux ges plus avancs est caractris par la croissance de la complexit morphmique le nombre de morphmes dun mot avec laccroissement des formes complexes qui sont ajoutes aux connaissances de vocabulaire alors que lenfant grandit. Anglin (1993), analysant la complexit morphmique des mots, observe que ce sont principalement les mots bimorphmiques qui croissent le plus rapidement, surtout entre le grade 3 et le grade 5. Si les mots drivs sont quantitativement plus appris et que ceux-ci sont pour la plupart bimorphmiques, on comprend leur meilleur apprentissage.
Le vocabulaire
73
Tableau 7
Estimation de la croissance journalire en mots selon leurs types morphologiques, daprs Anglin (1993) Type de mots Grade 1 Grade 5 3,00 1,92 9,67 3,86 1,57 20,02 1 an Grade 1 1,64 1,46 0,95 1,39 0,08 5,52 Grade 1 Grade 3 2,00 1,86 5,09 2,48 0,70 12,13 Grade 3 Grade 5 4,01 1,98 14,28 5,24 2,45 27,96
Mots racines .................... Mots inflchis .................. Mots drivs .................... Mot composs littraux ... Idiomes ............................ Total
Figure 6
Reprsentation graphique de lestimation de la croissance journalire en mots selon leurs types morphologiques, daprs Anglin (1993)
30
Nombres de mots nouveaux journaliers
25 Mots racines Mots inflchis Mots drivs Mot composs littraux Idiomes Total
20
15
10
0 1 an - grade 1 Grade 1 - Grade 3

Niveaux scolaires
Grade 3 - Grade 5
Une autre distinction notable est apporte par Anglin en matire de morphologie des mots. A la manire de Nagy et Anderson (1984) qui ralisent un dcoupage de SEM 0 SEM 5 de la difficult dinfrence du sens dun mot, Anglin distingue les mots quil qualifie
Le vocabulaire
74
de potentiellement apprenables par le biais de stratgies de dcompositions morphologiques des mots qui ne le sont pas. Dans sa classification, les connaissances antrieures des lves en vocabulaire sont bien sr hautement ncessaires dans les analyses morphologiques. Reprenant les transcriptions des entretiens mens auprs des lves dans ses preuves de vocabulaire, Anglin repre pour certains items la trace de rsolution de problmes morphologiques pour trouver le sens des items. Les rsultats a posteriori lui font constater que non seulement les taux de croissance augmentent alors que lenfant vieillit mais quil y a aussi un pattern changeant en terme de rapidit relative des taux associs entre eux accompagnant lge des lves. Plus explicitement, alors quentre les grades 1 et 3 llve fournit plus de rponses ne tmoignant pas de dcomposition morphologique, cette tendance sinverse entre les grades 3 et 5 (Cf. Tableau 8). Ce pattern de dveloppement suggre que la rsolution de problmes morphologiques joue un rle de plus en plus important dans le taux total de croissance du vocabulaire. Tableau 8 Taux estims de croissance du vocabulaire en mots par jour (analyse de rsolution de problmes), daprs Anglin (1993) Type de mots Indices de rsolution de problme ............................ Pas dindices de rsolution de problme ....................... Total Grade 1 Grade 5 10,64 9,38 20,02 1 an Grade 1 2,26 3,26 5,52 Grade 1 Grade 3 5,50 6,63 12,13 Grade 3 Grade 5 15,83 12,13 27,96
Ainsi, de manire croissante avec lge, les enfants peuvent dcoder les significations des mots inconnus morphologiquement complexes par des analyses morphologiques (fractionnement des mots complexes et identification des significations de leurs composants
Le vocabulaire
75
morphologiques). Il leur est alors possible de tenter de recomposer par un calcul dductif la signification de mots complexes. Gnralement, lorsque la scolarit entame labord de la lecture, les enseignants sont amens utiliser les diffrentes mthodes dapprentissage dcrites dans les paragraphes prcdents. Toutefois, celles-ci se rvlent plus ou moins performantes selon les lves, mettant en vidence lexistence de diffrences individuelles parfois marques.
4.3. Les diffrences individuelles

Les diffrences individuelles releves dans les tudes de vocabulaire sont gnralement considrables (Beck, McKeown, 1993 ; Lieury, 1996 ; Smith, 1941 ; Templin, 1957) et limportance de ces diffrences tend crotre avec lge. Parmi les principaux facteurs expliquant les diffrences individuelles constates chez les lves, on rencontre certes des effets lis lge et aux niveaux scolaires tudis mais aussi des effets lis au sexe, aux milieux socio-conomiques dorigine des lves et limportance de la lecture, autant dans la scolarit que pendant les activits de loisirs extra-scolaires.
4.3.1. Les diffrences entre garons et filles

La psychologie diffrentielle a pu mettre en vidence certains faits en matire de diffrences entre garons et filles. Si dans lensemble, les valuations globales de lintelligence ne marquent pas de diffrences entre les sexes, lexamen de certaines composantes intellectuelles plus spcifiques en relve. Dans le domaine des aptitudes spatiales, lavantage est donn au genre masculin tandis que le genre fminin a de meilleures aptitudes verbales (Robert, 1995). Mais ces diffrences ne sont pas trs importantes et peuvent trs bien sinverser ou sannuler en fonction de biais dchantillonnage (Huteau, 1995). Chez les filles, la supriorit moyenne dans le domaine verbal apparat trs tt. Leur avance sur les garons sobserve dans plusieurs activits telles que larticulation, le
Le vocabulaire
76
vocabulaire, lexpression ou encore la comprhension. Pour lacquisition du vocabulaire, cette avance des fillettes est estime une anne vers 4-5 ans (Maccoby et Jacklin, 1974). Toutefois, la plupart de ces diffrences ne se maintiennent pas par la suite, surtout pour le vocabulaire (Huttenlocher, Haight, Bryck, Selter & Lyons, 1991). On ne retrouve dailleurs pas de diffrences avres en matire dtendue des rpertoires lexicaux chez Templin (1957), Dupuy (1974) ou Anglin (1993) dans les rsultats de leurs preuves de vocabulaire. Si les filles ont la rputation dtre de meilleures lves que les garons, non seulement leur scolarit est plus longue que celle de leurs pairs mais elles nempruntent pas les mmes filires quand la formation se diversifie. Aussi, les comparaisons filles / garons se limitent gnralement aux annes scolaires prcdant cette diversification des formations. Huteau (1995) note que bien souvent les enseignants exagrent dans leurs systmes de notation les diffrences de rsultats scolaires entre garons et filles : les filles sont relativement surestimes en franais et les garons le sont en mathmatiques. Lauteur prsente un tableau extrait dune enqute du ministre de lducation nationale effectue auprs des notes scolaires de 10 000 lves de Seconde. Le Tableau 9 reproduit ces donnes. Tableau 9 Rsultats scolaires moyens en fonction du sexe pour cinq disciplines de Seconde (Ministre de lducation nationale, 1985-1986) Garons Franais ............................ Mathmatiques ................. Physique ........................... Anglais (crit) ................... Sciences naturelles ........... 9,7 8,8 7,9 7 9,6 Filles 11 7,6 6,4 8 9,4
Le vocabulaire
77
4.3.2. Le facteur milieu socio-conomique

Classiquement, on observe un effet d aux milieux socio-conomiques (MSE) des parents des lves dans certaines preuves de vocabulaire. Dans leur tude longitudinale de 1978, Ehrlich & coll. ont pu noter que les rpertoires verbaux des enfants sont dautant plus grands quils appartiennent des milieux socioconomiques favoriss. Dans leur classification en trois points de la connaissance des mots, les diffrences observes sont principalement centres autour des mots inconnus et moyennement connus. Les auteurs expliquent que les diffrences socio-conomiques releves se maintiennent durant les quatre annes tudies et ne marquent pas dinteraction entre milieux socio-conomiques et niveaux scolaires. En rapportant les diffrences laugmentation des connaissances durant la priode de scolarisation tudie (du CE1 au CM2), les trois chercheurs ont essay destimer ces diffrences en termes de retard. Les enfants du milieu le plus dfavoris auraient, par rapport leurs camarades du milieu le plus favoris, un retard de six mois daprs les preuves de jugement. Ce retard serait valu un an par rapport aux preuves de dfinitions. On se souvient que Flieller & coll. (1992) ont mis en vidence que la nature des preuves soumises aux lves donnent des rsultats diffrents chez les lves aux mmes items. Les auteurs ont galement constat des diffrences inter-preuves variant selon le milieu dappartenance des lves. Ces diffrences inter-milieux sont modules non seulement en fonction des preuves, mais aussi selon les critres dvaluation des rponses : les diffrences sont plus grandes avec des valuations de rponses libres quavec des critres plus stricts comme dans les QCM. Chez Anglin (1993), plusieurs rsultats indiquent aussi des diffrences en faveur des classes les plus aises dans le dveloppement du vocabulaire. Ces diffrences ne sont pas trs
Le vocabulaire
78
grandes cependant en regard des effets du niveau scolaire, du type de mots et de linteraction niveau scolaire type de mot significativement plus leve. Dans ltude dAnglin une
MANOVA sur le sexe, le niveau scolaire et les MSE renseignent sur le fait que les lves de milieux aiss qui apprendraient un peu plus de mots en moyenne ne seraient pas significativement meilleurs dans lutilisation de stratgies de dcomposition morphologique que les lves de milieux plus faibles.
4.3.3. La lecture : un facteur essentiel

Les connaissances en vocabulaire sont un des meilleurs prdicteurs dune aptitude verbale gnrale avec une corrlation proche de .80 (Anderson & Freebody, 1981 ; Sternberg & Powell, 1983 ; Jenkins, Stein et Wysocki, 1984). Jensen (1980), indiquant lui aussi que les tests de vocabulaire sont parmi les meilleures mesures de lintelligence, remarque que lacquisition des significations des mots dpend grandement de lduction de la signification partir des contextes dans lesquels le mot est rencontr . Le niveau de vocabulaire est aussi prdicteur dun niveau de comprhension de la lecture, mais il ne le dtermine pas seul. Comme lobserve Florin (1993), les connaissances lexicales sont une condition ncessaire la comprhension et la production des textes et la connaissance des choses . Ici, tous les aspects impliquant la lecture ne sont pas abords car ils rclameraient au minimum plus dun chapitre9. Nous dirons cependant que, dans ce processus long et complexe quest savoir lire, les chercheurs ont montr que le dveloppement dune conscience phonologique est ncessaire dans les premiers mcanismes dacquisition de la lecture (Stanovich, Cunningham & Feeman, 1984a, 1984b). Par ailleurs, apprendre lire
Pour une revue rcente sur la lecture, ses tapes dacquisitions et ses implications dans la russite scolaire, nous renverrons le lecteur louvrage de Jamet (1997).
Le vocabulaire
79
facilite rciproquement le dveloppement de la conscience phonologique (Ehri, 1984 ; Stanovich, 1986). Meilleure est la matrise de la lecture et plus son rle devient important dans les acquisitions des mots. Les chercheurs conviennent en effet que lexposition lcrit est un facteur essentiel dans lapprentissage principalement contextuel du vocabulaire (exemple de Cunningham & Stanovich, 1991 ; Anderson & Freebody, 1981 ; Just & Carpenter, 1987 ; Nagy & Anderson, 1984). Cunningham & Stanovich (1991) ont en effet montr que lexposition lcrit agit sur le niveau de lecture mme quand les effets de lge, du quotient intellectuel ou dautres facteurs linguistiques sont annuls statistiquement. valuer le niveau des lecteurs est donc dune grande importance quand on observe le dveloppement du vocabulaire dun individu. Se basant sur les manuels scolaires anglais, Nagy et Anderson (1984) se sont livrs au calcul du temps pass lire par rapport au niveau de matrise en lecture. Si un lve mauvais lecteur lit un peu moins de 10 pages par jour de livres illustrs dimages (avec une moyenne de 100 mots distincts par pages) pendant 100 jours scolaires, cest quelques 100 000 mots courants qui sont couverts. Un bon lecteur passant 50 minutes par jour scolaire, un taux de 100 200 mots par minutes, rencontra pendant ces mmes 100 jours entre 500 000 et 1 000 000 de mots de textes courants. Les auteurs indiquent quil nest pas draisonnable de penser que des enfants passant un peu plus de temps lire encore peuvent rencontrer jusqu 10 millions de mots courants annuellement. Carroll (1964) suppose mme que les lves de lyce peuvent tre exposs un million de mots par semaine dans leurs conversations, leurs lectures et en cours. Nagy et Anderson (1984) pensent quun lecteur moyen entre les grades 6 et 9 pourrait ainsi rencontrer au moins 5 000 familles de mots distincts par an, voire 10 000. Sur ce total,
Le vocabulaire
80
1 000 familles de mots seraient nouvelles par rapport lanne prcdente. Les deux chercheurs estiment quil est possible quun lecteur actif puisse aller jusqu 3 000 ou 4 000 nouveaux mots durant lanne scolaire. a ) Lecture et activits extra -scolaires
Dans la littrature, il existe peu dtudes renseignant prcisment sur le temps que consacrent les lves la lecture en dehors de lcole (pour la langue anglaise citons Anderson, Wilson & Fielding en 1988, Greaney en 1980 et Walberg et Tsai en 1984). Anderson & coll. (1988) ont essay dexaminer la relation entre ce temps consacr la lecture ailleurs qu lcole et le niveau de lecture. A 155 lves de grade 5 scolariss en ville et la campagne, les trois auteurs ont fait remplir chaque jour une grille dactivit extra-scolaires. Ltude a dur entre 8 et 26 semaines. Les lves ont inscrit le nombre de minutes consacres aux diffrentes activits proposes. Si la majorit des activits extra-scolaires se fait regarder la tlvision (2h 10 par jour), les rsultats montrent que ce temps pass devant le tlviseur est indpendant du niveau de lecture des lves. A contrario, la lecture (avec seulement 18 minutes journalires) est le meilleur prdicteur des valuations de russite en lecture. Mais, ltude met laccent sur le fait que la plupart des enfants ne lisent pas ou peu de livres rgulirement. Greaney (1980) a, lui, tudi les diffrents types de lecture des lves : livres, bandes dessines, journaux ou magazines. Il met en vidence que le sexe sest avr tre la distinction la plus forte, les filles consacrant plus de temps lire des livres alors que les garons sintressent majoritairement plus aux bandes dessins.
b )
Leffet Mathieu
La croissance avec lge et le niveau scolaire de la variabilit des connaissances en vocabulaire a suggr lexistence dun phnomne particulier : leffet Mathieu.
Le vocabulaire
81
Sous ce terme on dsigne laccroissement des diffrences entre bons lecteurs et mauvais lecteurs au fur et mesure que lon progresse dans lchelle des ges. Ce phnomne a t trs largement couvert dans une vaste revue de questions par Stanovich en 1986. Dune manire gnrale, on observe que les enfants ayant prcocement un vocabulaire relativement grand ont peu de difficults apprendre lire : ils prennent dailleurs plaisir ces activits de lecture et finissent par lire beaucoup. Ces enfants montrent dailleurs des gains grandissant en vocabulaire. A contrario, les enfants qui trs tt ont relativement peu de vocabulaire rencontrent plus de difficults apprendre la lecture. Prenant moins de plaisir dans cette activit, ils lisent trs peu. On constate chez eux un effet ngatif sur lapprentissage des mots car ils en apprennent relativement de moins en moins par rapport ceux qui lisent beaucoup. Ces effets Mathieu ont suggr Stanovich, West & Harrison (1995) de sintresser la croissance des connaissances des individus et au maintien de celles-ci trs long terme par rapport aux activits de lecture. Dans une exprience comparant 133 tudiants 49 personnes ges, ils ont administr aux sujets des preuves de connaissances gnrales, de vocabulaire, de mmoire de travail, de raisonnement avec syllogisme et plusieurs mesures de lexposition lcrit. Les rsultats suggrent un rle primordial des activits de lecture dans les diffrences individuelles en matire dacquisitions de connaissances et de leur conservation. Une srie de rgressions hirarchiques indique que dans chaque groupe dge, lexposition la lecture est un prdicteur significatif du vocabulaire et des connaissances dclaratives mme quand les diffrences sont contrles dans les tches de mmoire de travail, dans les habilets gnrales et le niveau ducatif. Inversement, les relations positives entre ge et vocabulaire, et ge et connaissances dclaratives disparaissent quand les mesures dexposition la lecture sont utilises comme variables contrles.
Le vocabulaire
82
5. C ONCLUSION
Parler des mots pour parler du vocabulaire est finalement une chose fort complexe et technique selon les points de vue des chercheurs que lon aborde. Les points relatifs la lexicographie, la lexicomtrie et la lexicologie nous ont renseigns sur lorigine de nos mthodes actuelles et par l mme de nos dfinitions du vocabulaire. Le chercheur rencontre souvent des difficults avoir une mesure simple des rpertoires lexicaux des adultes et des enfants : la varit des vocabulaires destimation et des vocabulaires de base est en effet trs grande. Toutefois, nous lavons dit, cette varit est principalement le fait de trois facteurs mthodologiques dans les tudes sur le vocabulaire. Ils tiennent aux choix des auteurs de leurs dfinitions de ce quest un mot, lextraction de leurs chantillons ditems et la nature des preuves soumises aux sujets jeunes ou plus gs. Quoi quil en soit, la croissance du vocabulaire est extraordinaire entre lge de 1 an et demi et lge adulte. Si dans les premiers ges, les relations conversationnelles parents / enfants, les activits de jeux entre frres et surs sont le thtre privilgi des apprentissages de mots, la scolarisation prend rapidement un rle essentiel dans le dveloppement du vocabulaire chez lenfant. Les objectifs sont dy donner des apprentissages basiques relatifs la langue naturelle tout en dveloppant une autonomie propre de ces apprentissages. Pour cela, on fournit aux lves les outils ncessaires leur autonomisation, principalement par le vecteur de la lecture. Matriser le savoir lire cest permettre aux enfants daccrotre leurs connaissances de leur langue maternelle ou dune autre. Bien sr, plusieurs facteurs modulent individuellement lapprentissage du vocabulaire, notamment les effets lis au sexe, au milieu socio-conomique et au niveau de lecture dun
Le vocabulaire
83
enfant. Que ce soit via lenseignement direct, linfrence en contexte ou la dcomposition morphologique, les lves, avec la nuance des diffrences individuelles, accroissent considrablement leurs rpertoires lexicaux en tendue et en richesse de significations. Les acquisitions se poursuivent durant toute la scolarit et ne sarrtent videmment pas lge adulte o les connaissances senrichissent encore : plus un individu a de connaissances du monde et plus cet individu connat de mots (Hunt, 1978). Selon Drum et Koponak (1987), chaque nouveau domaine dtude, chaque nouvelle passion ou hobby personnel ou toute autre exprience offre loccasion dtendre le lexique personnel, la fois horizontalement (dans le nombre de mots pour lesquels une signification est connue) et la fois verticalement (dans la profondeur des significations dun mot).
Le vocabulaire
84
85
Chapitre 2 LA MMOIRE
La mmoire
86
Savoir par cur n'est pas savoir : c'est tenir ce qu'on a donn en garde sa mmoire. Montaigne, Essais, I, 26.
1. I NTRODUCTION
Parler du vocabulaire, cest aussi expliquer les processus en jeu en mmoire dans lapprentissage des mots. Dans la Grce antique, la mmoire tait une chose importante : on la dsignait sous les traits de Mnmosyne, desse et mre des neuf muses prsidant la connaissance (Lieury, 1993a). Mais Descartes, avec le primat de la raison, a induit un rle moindre la mmoire dans le systme ducatif. Celle-ci a bien souvent t rduite aux seuls apprentissages par cur. De mme, les travaux sur lintelligence cantonnent la mmoire quelques mesures assez restreintes, privilgiant les tests de raisonnement pour expliquer les performances scolaires. Lintrospection bannie depuis le sicle dernier des recherches relatives la mmoi re, cest une approche scientifique de ces phnomnes que lon doit les perspectives actuelles de modlisations de la mmoire. Du bhaviorisme de Watson (1924) o le mcanisme basal de tout apprentissage reposait sur le schma Stimulus - Rponse la thorie de la Gestalt, ces formalisations du fonctionnement de la mmoire ont beaucoup volues depuis lors.
La mmoire
87
Avec le dveloppement de la perspective du traitement de linformation et celle de linformatique naissante des annes cinquante, les recherches en cognition nont cess depuis leur essor de montrer limportance de ces connaissances acquises en mmoire dans les activits scolaires et extra-scolaires. Ce chapitre expose diffrents aspects de la mmoire. Aussi pouvons-nous parler de plusieurs types de mmoires. La premire distinction qui sera faite est emprunte aux thories modulaires de la mmoire : elles mettent en vidence lexistence dune mmoire court terme et dune mmoire long terme diffrant par leurs fonctionnements et leurs capacits. Ce premier point nous permettra daborder les processus dorganisation de linformation puis de proposer diffrents modles rendant compte de la mmoire smantique. Cette notion de mmoire smantique sera le prtexte ltude de la conception rcente de Lieury (1991-1996) dune mmoire encyclopdique des connaissances scolaires et extra-scolaires. Lauteur nous claire en effet sur la relation existante entre la diversit des connaissances, scolaires ou non, et la russite scolaire.
La mmoire
88
2. M MOIRE COURT TERME VERSUS MMOIRE LON G

TERME
2.1. La mise en vidence de deux types de stockage

En 1956, Miller dans son fameux article le nombre magique 7 plus ou moins 2 a exprimentalement dmontr lexistence dune capacit limite en mmoire dlments. Si heureusement cette capacit se limite plus en termes dunits mmorisation de groupes dlments (mots, groupes de mots, phrases) que dlments seuls (Ehrlich, 1972), elle apparat bien infime au regard des capacits du moindre lve que lon interroge sur ses connaissances. Aussi, il est possible denvisager lexistence de plusieurs types de mmoire. Depuis Miller, cette problmatique a donn lieu dans la littrature dabondantes rponses en terme de modlisations et de paradigmes exprimentaux. On peut distinguer une premire structure de mmoire appele mmoire court terme. Celle-ci est caractrise par une capacit limite releve par Miller (1956) saccompagnant dun oubli massif et rapide (Murdock, 1962 ; Peterson & Peterson, 1959). Par opposition, la mmoire long terme renferme un nombre difficilement calculable de connaissances soumises un oubli plus progressif. Lune des dmonstrations dune distinction entre deux types de stockage en mmoire est le fait de la technique des effets sriels, mise au point par Murdock en 1962.
2.1.1. Les effets sriels

Cette technique permet en effet de distinguer deux types de stockage, lun court terme, lautre long terme. Dans ce paradigme, une liste de mot est prsente des sujets. Ceux-ci ont pour consigne de rappeler, immdiatement aprs la prsentation, les items dans n'importe
La mmoire
89
quel ordre (Craik, 1970 ; Glanzer et Cunitz, 1966 ; Murdock, 1962). En recueillant le pourcentage de mots correctement rappels selon leur position srielle dans la liste, il est possible dobserver que les mots du dbut et ceux en fin de liste sont mieux restitus que les items du milieu. On nomme respectivement effet de primaut et effet de rcence la caractrisation de ces meilleurs rappels pour les premiers et derniers mots dune liste. Lorsque la liste ditems nest pas restitue en rappel immdiat mais en rappel diffr avec une tche intermdiaire comptage rebours dun nombre, par exemple on observe que seul leffet de primaut subsiste : les derniers mots ne sont en effet pas mieux rappels que ceux du milieu. Linterprtation donne est que l'effet de rcence reflte un stockage court terme des items tandis que l'effet de primaut tmoigne dun stockage long terme. Ainsi, en rappel diffr, intervient un oubli rapide des informations contenues en mmoire court terme : la tche interfrente efface la mmoire court terme do le dclin des derniers items de la liste.
2.1.2. La technique Brown-Peterson

Cet oubli massif et rapide dinformations simples en mmoire court terme a galement t mis en vidence par Brown (1958) et par Peterson & Peterson (1959). Ces deux derniers auteurs ont prsent des sujets des squences de trois consonnes (exemple HBX ) suivies dune tche concurrente, frquemment appele depuis lors tche Peterson . Dans cette tche interfrente, le sujet doit compter rebours et voix haute de trois en trois avant de faire son rappel. Les chercheurs ont manipul la dure de la tche concurrente entre 0 et 18 secondes. A 0 seconde le rappel est parfait mais les rsultats montrent un dclin trs important jusqu disparition du rappel 18 secondes. Si Keppel et Underwood (1962) remarquent lexistence dinterfrence proactive de par la prsence de nombreux trigrammes dans ltude, ces rsultats dmontrent bien toutefois lexistence dun stockage court terme en mmoire.
La mmoire
90
2.1.3. Une preuve neurologique : lamnsi e de Korsakoff

En mdecine, il existe une pathologie connue sous le nom damnsie antrograde gnrale de Korsakoff qui confirme la distinction entre les deux types de stockages voqus. Les patients qui en souffrent, sils parviennent rappeler court terme des items ne le peuvent plus long terme (exemple du cas HM dcrit par Milner, 1970). Cette maladie est due la destruction des structures hyppocampiques dans le cortex (Karli, 1969). Toutefois, des chercheurs ont pu montr que cette amnsie semble atteindre plus la mmoire explicite que la mmoire implicite. Selon Lieury (1997), une explication possible tiendrait ce que la mmoire implicite correspondrait lactivation de la mmoire long terme avant de passer par lhippocampe . A la base de la mmoire explicite (impression de dj vu), la structure hippocampique aurait pour fonction de comparer entre elles informations antrieures et informations nouvelles.
2.2. Vers une conception modulaire de l a mmoire

Il est de fait que la perspective introduite par le traitement de linformation (Cf. Shannon & Weaver, 1949) a donn ses lettres de noblesse aux Sciences Cognitives et a t fort heuristique pour la majorit des recherches de la Psychologie contemporaine. Certains auteurs ont utilis des schmas de type informatique pour proposer leurs modles synthtiques de la varit des codes, structures et processus en jeu dans la mmoire. A lexception des connexionnistes, un mme point rallie ces travaux : les diffrentes fonctions de la mmoire peuvent tre reprsentes sous une forme modulaire de processus10. On leur prte le nom de modles boxologiques (en botes).
10
Axe sur ltude des rseaux de neurones, on reconnatra que la perspective connexion niste (Rumelhart & coll., 1986), hritire des conceptions no-bhavioristes, est un courant qui se dveloppe en Psychologie
La mmoire
91
2.2.1. Le modle de Broadbent (1958)

Le modle de Broadbent (1958) est le premier reprsenter la distinction entre mmoire court terme et mmoire long terme. La mmoire court terme est considre ici comme une mmoire dattente permettant de stocker temporairement linformation avant quelle ne passe en mmoire long terme. Son modle permet de voir de manire approximative les mcanismes de loubli court terme (Peterson & Peterson, 1959).
Figure 7
Figure simplifie du modle de Broadbent (1958)
r S F P
Rcepteurs priphriques (registres sensoriels) Stockage court terme Filtre slectionnant un seul lment traiter par le canal capacit limite et conservant les lments qui seront traits ultrieurement Processus de traitement de linformation (canal de traitement central)
cognitive. Introduisant effectivement une nouvelle approche des phnomnes linguistiques classiques elle soppose assez radicalement aux conceptions modulaires de la mmoire. Selon ce courant, il nest pas ncessaire de postuler lexistence dentits cognitives distinctes que lon nommerait modules pour rendre compte des acquisitions. Aussi, il ny a pas dquivalent au terme de structure des conceptions modulaires de la mmoire. Par exemple, lapproche connexionniste du traitement dune phrase envisage les processus de comprhension dun tel corpus en termes de satisfactions de contraintes. Elle considre une repr sentation rpartie des concepts. Ainsi, chaque mot est considr comme une configuration particulire dactivations sur un ensemble dunits. Les divers composants dun concept sont alors activs en parallle (ou quasi -parallle), do le nom de modles en cascade pour ces conceptions des traitements cognitifs. De mme, la phrase est envisage comme une configuration dactivations au sein de limmense rseau neuronal. Un intrt pour une telle organisation rpartie rside en ce que la mmoire lexicale et les units de traitement ne consistent pas en mots individuels (Corson & Blanchard, 1993). La connaissance entendons lensemble des informations qui sont lies au concept est imbrique dans un ensemble de poids sur les units de traitement. Celles-ci encodent la fois les proprits orthographiques, phontiques et smantiques des mots et leurs corrlations. Cette approche est intressante dans les modlisations quelle propose sur la formation des concepts, par exemple. Mais nous ne la prendrons pas en considration, car la majorit des tudes sy rattachant nutilisent pas de matriels cologiques par rapport aux situations dacquisitions scol aires. Concevoir, simuler le comportement dun systme apprenant en temps rel par rapport aux informations linguistiques qui lui sont soumises est prodigieux. Rapprocher ces ralisations dun modle humain cologique est plus dlicat
La mmoire
92
De la distinction entre mmoire court terme (MCT) et mmoire long terme (MLT) du modle de Broadbent en 1958, on retient que sil rend compte des systmes de stockage ncessits il est peu explicite sur la nature des informations traites.
2.2.2. Le modle dAtkinson et Shiffrin (1968)

Une volution est apporte dans la proposition thorique de Shiffrin et Atkinson, en 1968. Leur conception porte sur une analogie cerveau humain / cerveau ordinateur, caractristique de lemprunt des recherches dalors. Est pose la dichotomie entre structures, dune part, et processus de contrle, dautre part. Les structures correspondent trois types de stockage dont les caractristiques sont permanentes et non modifiables (les registres sensoriels, les stockages court terme et long terme) associes un gnrateur de rponse. La mmoire court terme est considre comme la mmoire de travail du sujet : dans celle-ci sont reues des informations slectionnes dans les registres sensoriels ainsi que dans la mmoire long terme. Estimant quau bout de 30 secondes une information peut disparatre de la mmoire court terme, Atkinson & Shiffrin prcisent quil est possible au sujet dviter cela grce lautorptition. Le rafrachissement de linformation en mmoire court terme autorise ainsi le maintien dune quantit limite dinformations tant que le sujet la rpte. Mais seul le transfert dune copie de ces informations en mmoire long terme permet que celles-ci soient conserves. Quant aux processus de contrle, ils sont composs de mcanismes dorganisation et de rcupration de linformation. Fonctionnellement, chaque type dinformation suit les mmes tapes de traitements mais partir de registres sensoriels spcifiques la nature de linformation reue dans ce systme.
La mmoire
93
Figure 8
Modle dAtkinson & Shiffrin (1968) - Les flches pleines indiquent le trajet de linformation - Les flches en pointill indiquent les signaux de commandes
TRAITEMENT DE CONTRLE : Critres de dcision Stratgies
ENTRE
Autorptition
MMOIRE SENSORIELLE
MMOIRE COURT TERME
Transfert
MMOIRE LONG TERME
Disparition : Perte de linformation
GNRATEUR DE RPONSES
SORTIE
Il existe une corrlation entre dure du maintien en mmoire et probabilit de rappel dans des expriences ralises en apprentissage intentionnel (Rundus, 1971, 1977 ; Geiselman, Woodward & Beatty, 1982). Cependant, le cadre thorique propos par Craik (1976) conduit tudier la relation entre autorptition et mmoire en fonction du niveau dlaboration du traitement ralis par le sujet : dans ce cas, augmenter la dure de maintien en mmoire en augmentant le nombre de rptitions nest efficace que si le sujet peut profiter de cette dure dautorptition plus grande pour approfondir le traitement en cours. Bien que critiqu, notamment au niveau de lidentification des stimuli et de leur codage avant le stockage court terme (Cowan, 1988), ce modle dAtkinson et Shiffrin a marqu son poque par une distinction trs nette entre les deux types de stockages voqus. Si beaucoup dauteurs se sont inspir de ce modle, leurs travaux plus rcents (Cowan, 1988 ; Lieury, 1992a) montrent une frontire moins tranche entre mmoire court terme et mmoire long terme.
La mmoire
94
2.2.3. Le modle de Lieury (1992)

Cette nouvelle gnration, pourrait-on dire, reprsente la mmoire comme un ensemble de systmes ou de modules de traitement (Tulving, 1985). Cette ide dune structuration fonctionnelle et modulaire de la mmoire est de plus en plus admise, renforce par le recoupement de travaux en neurosciences. Ici, chaque module est distinct, caractris par un code, mais aussi chaque systme a un mode de fonctionnement court terme et long terme (Lieury, 1992a). Un tel modle comporte des systmes de codages sensoriels (pour les modalits visuelles et auditives) et moteurs (pour les rponses verbales). Il comprend galement un systme lexical et son pendant, un systme de traitement imag. Sont aussi comprises, une ou plusieurs mmoires sensori-motrices et la vaste mmoire smantique (Cf. Figure 9). Figure 9 Modle modulaire de la mmoire (Lieury, 1992a)
Modalits sensorielles diverses
Rponses motrices
visuel
auditif
articulatoire
Rponses vocales
Autorptition
Mmoire sensori-motrice Mmoire des images Mmoire pictographique
Sons & musique

Solfge
Codage phonmique
Mmoire graphique
Lecture
Code lexical
Mmoire
Mmoire des visages Mmoire visuo-spatiale
smantique
activation court terme mmoire de travail Multi-fentrage
Mmoire fichier
Mmoire court terme
La mmoire
95
Cest sur ce dernier modle dune formalisation modulaire de la mmoire que nous nous appuyons dans cette thse. Il est, mon sens, des plus adquats pour expliquer les implications fonctionnelles de la mmoire lexicale et de la mmoire smantique dans lacquisition des connaissances. Cette modlisation des mmoires permet denvisager lexistence dune activation court terme des informations stockes selon diffrents codes (lexical, smantique, imag). Selon Lieury (1992a p 92), la mmoire court terme nest pas localisable dans un tel modle car elle est conue comme lensemble des informations stockes court terme mais dans diffrents systmes un moment donn . Lauteur indique que cette mmoire court terme aurait tantt le rle dune mmoire tampon (stockage temporaire des informations pour leur traitement) tantt serait une mmoire de travail (Baddeley & Hitch, 1974 ; Baddeley 1986, 1992) ou fonctionnerait la manire dune mmoire fichier (Lieury, 1992a).
2.3. Mmoire de travail et mmoire fichier

2.3.1. La mmoire de travail (Baddeley, 1986)
Nous lavons dit prcdemment, le modle dAtkinson et Shiffrin parlait ds 1968 de mmoire de travail pour qualifier le fonctionnement de la mmoire court terme. Ce sont pourtant Baddeley & Hitch en 1974 (Cf. Figure 10) qui vont prsenter les premiers une modlisation de cette mmoire de travail. Cette modlisation est laboutissement thorique dun problme dinterprtation des donnes rencontr par Baddeley dans des tudes antrieures. Dans celles-ci, les rappels de sujets devant retenir des squences de chiffres tout en accomplissant une autre tche (verbale principalement) sont trs faibles.
La mmoire
96
Baddeley & Hitch (1974), et beaucoup dautres avec eux, se sont alors engags dmontrer que dans des activits de doubles tches (tches concurrentes), si la mmoire court terme est occupe, on peut prdire un blocage des capacits de traitement cognitif par ce modle. La dfinition de Baddeley (1993) fait apparatre la mmoire de travail comme un systme servant retenir temporairement les informations et les manipuler pour une gamme importante de tches cognitives telles que lapprentissage, le raisonnement et la comprhension . Le modle de la mmoire de travail de Baddeley et Hitch (1974) met en jeu la gestion par le sujet de ses ressources attentionnelles et de ses ressources de travail (voir Baddeley 1993 pour une revue). La modlisation comprend un processeur central (ou centre excutif) responsable des processus de contrle attentionnel. Ce centre excutif, encore appel administrateur central, supervise deux systmes esclaves en slectionnant les stratgies cognitives utiles et en assurant la coordination des informations provenant de diffrentes sources. Ces deux systmes esclaves sont la boucle articulatoire et le bloc-notes visuo-spatial. La boucle articulaire ou boucle phonologique manipule les informations langagires. En interne, elle comporte une unit de stockage phonologique et un processus de contrle articulatoire. Ce systme dans le systme permet de rendre compte de diffrents effets tels que la suppression de la subvocalisation notamment. Quant au bloc-notes visuo-spatial (encore dsign sous les termes de calepin ou ardoise visuo-spatiale), il est responsable du stockage court terme de l'information visuo-spatiale et de la manipulation des images mentales.
La mmoire
97
Figure 10
Reprsentation simplifie du modle de mmoire de travail (Baddeley & Hitch, 1974)
Bloc-notes visuo-spatiale
Boucle phonologique
Centre excutif
2.3.2. La mmoire fichier (Lieury, 1992a)

Hulme, Roodenrys, Brown & Mercer (1995) ont pu montrer une influence de la mmoire long terme sur les performances de lempan mnsique. Ce rsultat tonnant a t observ dans une tche dempan classique utilisant des mots et des non mots diffrents selon la longueur de la verbalisation. Si les performances de lempan mnsique et la longueur de verbalisation sont relies par une fonction linaire pour les mots et non mots, le rappel de ces derniers demeure pourtant toujours infrieur celui des mots sans que la longueur de verbalisation puisse lexpliquer. Mais, lorsque les sujets sont familiariss au pralable la prononciation de non mots, Hulme & coll. remarquent que lempan mnsique de ces sujets augmente. Ici, une explication compatible avec la mmoire fichier de Lieury est que la familiarisation via les rptitions de non mots a cr une fiche lexicale stocke en mmoire lexicale long terme. Lieury (1992b) et Etessamipour ont fait la mme constatation propos de lapprentissage de mots du franais entre un groupe dtudiants franais et trangers. Chez les tudiants trangers dbutants pour la langue franaise, lapprentissage de mots simples en seize essais montre que ces mots simples ne sont faciles que pour les tudiants franais qui
La mmoire
98
ont dj des connaissances antrieures de ces items : seuls les tudiants franais ont un empan mnsique de 7 mots. Avec des tudiants trangers de troisime ou de quatrime anne de franais, les rsultats pour les mots simples sont similaires aux tudiants franais. En utilisant des listes de mots variant dun niveau de difficult de 1 (mots faciles et trs courants) 5 (mots difficiles et trs peu employs) dans un mme paradigme, les rsultats obtenus montrent que le rappel court terme des mots de niveau 5 est beaucoup plus difficile que le rappel des mots de niveau 1. Ces rsultats sexpliquent par un fonctionnement de la mmoire court terme assimile une mmoire fichier o ne sont stocks que les indices. Cette mmoire sappuie sur les mcanismes de rcupration. A la manire de la FAT dun disque dur ou encore des fiches dune bibliothque, cette mmoire fichier stocke seulement les indices dun groupe dinformation : le contenu de ces informations, quel que soit sa taille, est accessible ailleurs en mmoire long terme. Dans le modle de Lieury (Cf. Figure 9, 1992a), il existe un recouvrement partiel entre la mmoire de travail court terme et la mmoire fichier. Lauteur indique par l que la quantit de ressources disponibles en mmoire de travail conditionne le stockage dindices en mmoire fichier : plus les ressources sont faibles et moins il y a dindices stocks en mmoire fichier.
La mmoire
99
3. O RGANISATION ET MMOI RE
3.1. Organisation et encodage de linformation
3.1.1. La notion de chunk
Miller en 1956 a clairement dmontr lexistence dune capacit limite de la mmoire court terme pour des items sans relation. Heureusement, il tablit que cette limitation de lempan mnsique peut tre dpasse. En reprenant une tude de Smith (1954), Miller introduit la notion de chunk (regroupement). Cette notion permet de rendre compte de lorganisation du matriel lencodage de linformation autorisant le dpassement de la capacit limite. Smith, en effet, a tudi sur lui-mme la mmorisation de chiffre binaire (0 1). En apprenant une correspondance entre le code binaire et diffrents autres codes (de base 4 jusquau code dcimal base 10), lauteur a observ quil pouvait mmoriser plus dlments que son empan naturel (12 en loccurrence). Par exemple, la squence binaire 000101001110, regroupe par 3 chiffres donne 000 101 001 110 soit lapprentissage dun code 0 5 1 6 beaucoup plus conomique pour lempan mnsique. Il est alors possible grce cette conomie de mmoriser une plus grande srie de chiffres. Smith parvient ainsi, par regroupement de 4 et 5 chiffres retenir prs de 40 chiffres binaires. La notion de regroupement ne vaut pas uniquement pour les squences de chiffres. Dautres modes dorganisation rendent galement compte de ce phnomne de chunking. Aussi la capacit limite de la mmoire nest plus interprte en terme dlments dinformations retenir mais en termes de chunks.
La mmoire
100
3.1.2. La catgorisation
En matire dorganisation, le premier phnomne constat est celui de la catgorisation. Si celle-ci a t trs largement tudie (notamment Boltwood & Blick, 1970 ; Bower, 1969 ; Bower, Clark, Lesgold & Winzenz, 1969 ; Nelson & Schreiber, 1992 ; Rundus, 1971), sa dmonstration initiale en revient Bousfield en 1953. Dans une tude prsentant une liste de 60 mots mlangs provenant de diffrentes catgories smantiques, lauteur remarque que les sujets ont tendance reconstituer au rappel les catgories de ces mots. Wood (1969) confirme cela dans une exprience o il compare les performances en rappel sur plusieurs essais de deux groupes exprimentaux. Le premier groupe de sujets apprend une liste de 54 mots groupant 18 catgories de 3 mots alors que le second reoit ces 54 mots de manire randomise. A lissue du troisime essai, les rsultats montrent une nette supriorit du premier groupe (condition organise) face au second groupe (condition inorganise). Bower, Clark, Lesgold & Winzenz (1969) ont eux aussi montr que la rcupration de linformation est facilite si la structure du matriel apprendre est organise. Ils ont donc construit 4 listes de 28 mots (total de 112 mots) pouvant tre organiss en arbres conceptuels. Ces listes ont t construites partir de rgles taxonomiques usuelles. Un premier groupe de sujets reoit le matriel organis (arbres conceptuels incluant catgories et supercatgories), le second reoit ces listes dans une condition non organise (28 mots randomiss parmi les 112 pour chacune des 4 planches). Alors quau rappel le groupe en condition inorganise restitue en moyenne 21 mots sur les 112, le groupe en condition organise rappelle quelques 73 mots. Roenker, Thompson & Brown (1971) on mis en vidence quentre ces deux conditions il existe aussi des stratgies de rcupration des mots qui sont diffrentes. Pour cela ils ont calcul un indice dorganisation, lARC (Adjusted Ratio of Clustering). Ce calcul fournit un indice de la frquence des changements de catgorie entre mots successivement rappels par un sujet donn. Cet indice a le mrite dtre indpendant du nombre de mots rappels. En
La mmoire
101
condition non organise, lARC (compris entre 0 et 1) tend vers 0 dmontrant quen rcupration les sujets dans cette condition restituent les items en changeant frquemment de catgorie. En condition organise, lindice tend vers 1, les sujets changeant moins frquemment de catgories lorsquils rappellent le matriel. Ainsi, la catgorisation smantique dun matriel permet-elle de dpasser la capacit limite de Miller (1956) en mmoire court terme.
3.1.3. Organisations verbale et image

En 1974, Garten & Blick ont mis en vidence que les phrases ont un rle intgrateur dans la mmorisation dune liste de couples de mots. Leur exprience comporte trois conditions de prsentation de la liste. Dans la premire condition, les paires de mots cibles sont intgres dans des phrases. Dans la deuxime condition, cest un mot cl qui relie les couples de mots alors que dans la troisime condition les mots sont simplement rpts. Les conditions phrases et mots cls obtiennent de meilleures performances en rappel que la troisime condition. Les auteurs suggrent que les phrases ont un rle intgrateur en mmoire : selon eux, les phrases autorisent des liaisons smantiques entre les couples de mots du matriel, ce qui facilite leur apprentissage. Si ces expriences dmontrent une organisation verbale des informations, il est montr que le code imag peut aussi faciliter le dpassement de la capacit limite en mmoire court terme en organisant les informations. Ducharme & Fraisse (1965) et Paivio (1969) ont remarqu que la prsentation dun dessin permet un meilleur rappel de l'objet que la prsentation du nom de ce mme objet. De plus, Paivio (1969) indique que les mots abstraits sont moins bien rappels que les mots concrets. Selon sa thorie du double codage des images, la supriorit des images sur les mots sexplique par la prsence de deux codes, verbal et imag, pour le stockage de limage. Si les
La mmoire
102
images possdent un codage verbal supplmentaire, le double codage apparat galement dans le matriel verbal lorsque celui-ci est facilement imageable : cest le cas des mots concrets ; un mot concret est donc plus facile mmoriser quun mot abstrait car il possde un degr dimagerie suprieur. Bower (1970) a dmontr que limage pouvait tre utilise pour organiser linformation car elle y joue aussi un rle intgrateur en mmoire. L'exprience, qui porte sur l'apprentissage de paires associes o chaque mot utilis a une forte valeur d'imagerie, sintresse aux performances du rappel indic de trois groupes exprimentaux. Le premier (groupe contrle) reoit comme consigne de seulement rpter les paires pendant les 10 secondes de prsentation. Le second groupe doit sefforcer de former une image pour chaque paire ditems alors que le troisime groupe a pour instruction de se reprsenter les deux mots dans une mme image. Bower observe que la condition o les sujets intgrent les paires associes en une image obtient un rappel indic de 53 %. Ce chiffre est de loin suprieur la condition des deux images spares (30 %) et au groupe contrle (27 %). La non diffrence entre ces deux derniers groupes montre bien que cest lorganisation image des informations qui autorise un meilleur rappel et non les seules valeurs dimagerie de ces informations. Comme le rappelle Lieury (1992b), cette intgration par limage a t lun des premiers procds mnmotechniques utiliss travers lhistoire.
3.1.4. Lorganisation subjective

Tulving en 1962 a introduit une notion supplmentaire sur ce thme de lorganisation du matriel lencodage. Il sest en effet aperu que les sujets avaient tendance rappeler les mots dans le mme ordre lors de plusieurs essais successifs car, comme le note Mandler (1977), l'organisation impose par l'exprimentateur ne concide pas forcment avec l'organisation utilise par les sujets . A cette organisation particulire du matriel restitu, Tulving a donn le nom dorganisation subjective. En fait, cette organisation subjective a t
La mmoire
103
mis en vidence par Tulving (1962), Ehrlich (1965) et Mandler, Pearlstone & Koopmans (1969) de plusieurs manires. Dans le paradigme de Tulving (1962), la diffrence des tudes prcdentes o le matriel est pralablement organis (Bousfield, 1953 ; Bower & coll., 1969), lordre des items est quasi alatoire. Ces rsultats indiquent que le changement d'ordre de prsentation des mots na pas dinfluence sur lordre de leur restitution. Lexamen des rponses fait apparatre que celles-ci sont de plus en plus strotypes en fonction des essais. Les conclusions en sont que les sujets laborent une structure dorganisation interne de ces items en crant leurs propres catgories. Sur cette ide dorganisation subjective, Mandler, Pearlstone & Koopmans (1969) ont examin le nombre de catgories libres que les sujets utilisent pour trier un ensemble de 100 mots. A la suite de ce tri, sont organiss un rappel et une reconnaissance, soit immdiatement aprs la tche, soit avec un diffr dune semaine. En sintressant la relation entre le rappel et le nombre de catgories employes dans la tche de tri, les auteurs observent des corrlations positives dans toutes les conditions entre ces deux variables. Cela est interprt en terme dorganisation subjective de linformation par les sujets. Tulving, en 1962, sest en fait inspir de Miller (1956) qui pensait que la rptition tait un facteur de lorganisation des items en chunks. Ehrlich, qui emploie le terme de structuration en mmoire (Ehrlich, 1965), sest intress comme Rundus (1977) la rptition en mmoire dinformations. Il montre en 1972 que la rptition est soumise au phnomne de structuration. Dans une exprience, il a prsent chaque essai dapprentissage seulement 16 des 24 items dune liste complte. Ces 16 items apparaissent dans un ordre diffrent de la prsentation prcdente chaque nouvel essai. Les rsultats dmontrent que les sujets sont incapables de rappeler les 24 mots de la liste mme aprs une vingtaine dessais. Ehrlich met
La mmoire
104
ainsi en vidence que la mmorisation dlments non ordonns ou sans relation est galement soumise lorganisation de linformation. Ehrlich (1976) prcise que dans ce processus dorganisation subjective les traitements dune information, soit reproduisent et renforcent une organisation ancienne, soit modifient une organisation ancienne, ou crent une organisation nouvelle. En tout tat de cause, une transformation transitoire ou durable dune partie du systme smantique a lieu. Cette modification peut sobserver directement par un accroissement de lorganisation subjective (Tulving, 1962) au cours des essais ou indirectement par une augmentation des rponses correctes des sujets.
3.2. Organisation et rcupration

Dans les activits de mmoire, on distingue gnralement les phases de mmorisation de celles de conservation et de restitution des informations, ces distinctions tant inspires une fois encore de lanalogie heuristique homme/ordinateur. Cest cette phase de rcupration des informations stockes que nous allons maintenant dvelopper. La rcupration a pour fonction de retrouver en mmoire long terme une information parmi les milliards dautres qui sy trouvent. Aussi, rcuprer une information particulire doit se faire le plus prcisment et le plus rapidement possible.
3.2.1. Les indices de rcupration

La premire recherche mettant en vidence le rle des indices de rcupration a t ralise par Tulving & Pearlstone en 1966. Ces auteurs distinguent ainsi stockage de linformation et restitution de celle-ci. Ils formulent lhypothse quune partie des informations peut tre stocke mais non accessible au sujet. Pour cela, ils ont mis au point une tude utilisant en prsentation des listes de mots prorganises par catgories. Les auteurs manipulent la longueur de la liste ditems (12, 24 ou
La mmoire
105
48 mots), le nombre dexemplaires par catgorie (1, 2 ou 4 instances) ainsi que le type de rappel (rappel libre ou rappel indic du nom des catgories utilises). Durant la phase de mmorisation, le sujet se voit prsenter pour chaque item le nom de la catgorie et son instance. A lexception de la condition 12 mots (3 catgories de 4 items) o les deux types de rappel sont identiques, le rappel indic montre une nette supriorit des performances par rapport au rappel libre. Dailleurs, cet effet des indices de rcupration est dautant plus important que la liste ditems mmoriser est grande. Si la taille de la liste ditems a une incidence sur le nombre de catgories rappeles, le nombre dinstances restitues par catgorie est quivalent dans les deux types de rappel. Cela demeure stable quel que soit le nombre de catgories prsentes. Tulving et Pearlstone (1966) considrent que ces rsultats rendent compte de deux processus distincts en jeu dans le rappel : lun est laccessibilit des units de haut niveau reprsentes par les chunks que sont les noms de catgories, lautre est laccessibilit des exemplaires dans ces units de haut niveau. Lide est quen rappel il est ncessaire de restituer lorganisation des chunks dinformations tels quils sont stocks. Les recherches sur loubli en mmoire ont grandement appris de cette tude. En effet, lexprience de Tulving et Pearlstone a permis de montrer que loubli en rappel libre nest pas une absence de stockage dune information mais bien un manque dindices autorisant laccs et la rcupration de cette information en mmoire. Si rcuprer une information cest rcuprer ses indices en mmoire court terme, il existe un lien entre ces indices et la mmoire fichier de Lieury (1992a). Dans ce modle, il est montr que les sujets accdent aux informations grce leurs tiquettes ou adresses disponibles en mmoire court terme. A partir de ce paradigme original de Tulving & Pearlstone, beaucoup de recherches vont sintresser aux indices de rcupration. Ainsi, lefficacit du rappel indic pour des listes de
La mmoire
106
mots catgoriss va tre montre par de nombreux auteurs (notamment Bahrick, 1971 ; Basden & Draper, 1973 ; Earhard, 1967 ; Lieury, 1976 ; Wood, 1967, 1969) dans diffrents paradigmes exprimentaux.
3.2.2. Reconnaissance et mmoire pisodique

Un autre moyen bien connu de sonder le stockage dinformations mmorises est la reconnaissance. Depuis longtemps cette mthode a montr quelle tait la plus puissante en matire dexamen de la rtention (Lieury, 1997 ; Tiberghien & Lecocq, 1983) quelle que soit la nature des items (mots, images, visages). A la lumire des paragraphes prcdents sur les indices de rcupration, la reconnaissance ditems peut tre considre comme une situation particulire de rappel. Si on plaait les trois modes de rcupration sur un gradient defficacit, le rappel libre serait le mode de restitution le plus faible (avec 0 indice), suivi du rappel indic et de la reconnaissance. La plus grande efficacit de cette dernire mthode sur le rappel libre et le rappel indic sexplique par la prsence de lindice le plus riche (item cible) parmi les piges (Lieury, 1997). Tulving (1972) en introduisant la notion de mmoire pisodique a montr que la mmorisation ditems se fait avec des informations contextuelles. Il pense en effet que lorganisation mnsique se cre selon les circonstances dans lesquelles une information est rencontre. Lencodage dune information cible se fait avec des donnes contextuelles spatiotemporelles ou smantiques. Ces circonstances associes et stockes avec les lments retenir sont appeles pisodes. La conception initiale de Tulving considre deux sortes de mmoires. La premire est une mmoire pisodique qui stocke les informations telles quelles sont perues dans leur contexte : cette conception est proche de lide de mmoire autobiographique de Baddeley
La mmoire
107
(1990). La seconde est une mmoire associative qui concerne les relations entre les mots. Cette conception semblable la mmoire smantique fait abstraction des lments temporels et spatiaux du contexte propres une mmoire autobiographique. Selon ce modle, une dissociation existe entre les principes de continuit et de contigut : lencodage spcifique dcrirait la rcupration en mmoire pisodique tandis que lhypothse de continuit associative dcrirait la mmoire smantique. En 1970, Thomson & Tulving montrent que la prsentation dune association faible ou forte permet de faire varier les pourcentages de mots rappels. Pareillement, la prsentation ou labsence dindices agit sur le rappel. Aussi, si on utilise la mthode de la reconnaissance pour examiner la rtention, on fournit au sujet le maximum dindices sur le contexte de prsentation des items : cela facilite dautant la restitution du matriel mnsique. Pourtant, Tulving & Thomson (1971), et rcemment Charles (1997) avec des distracteurs rpts, ont montr que la variation du contexte pouvait affecter les performances en reconnaissance. Tulving & Thomson (1971) ont demand des sujets dapprendre des mots cibles (exemple art ) selon un certain contexte (exemple, art fille ) en changeant de manire exprimentale le contexte de reconnaissance du mot cible ( art seul ou art tige ). Les deux auteurs constatent une baisse de la reconnaissance lorsque le contexte de reconnaissance est ainsi modifi. Les diffrents principes dorganisation que nous venons dvoquer permettent de mieux comprendre par quels mcanismes fondamentaux les connaissances sont encodes et restitues. Lexamen de la mmoire smantique des connaissances simpose maintenant.
La mmoire
108
4. L A MMOIRE SMANTIQUE
Dans le modle initial de Tulving (1972) la mmoire pisodique tait bien distincte de la mmoire smantique (ou mmoire associative). Les travaux actuels ont nuanc cette position dichotomique (Lieury, 1979 ; McKoon, Ratcliff & Dell, 1985). Si des preuves neuropsychologiques viennent tayer cette distinction (Van Der Linden & Hupet, 1994), Tulving (1985) rejoint pourtant les autres auteurs en proposant que le systme de la mmoire pisodique soit reli la mmoire smantique. Lieury (1979) parle quant lui dembotement de la mmoire pisodique dans la mmoire smantique. Pour rendre compte de la mmoire smantique, la plupart des expriences des modles hirarchiques et ensemblistes reposent sur la mesure du temps mis par les sujets dcider si des propositions sont vraies ou fausses (Collins & Quillian, 1969). Pour dcider, le sujet doit faire appel aux significations des catgories smantiques des phrases. La mesure des temps de rponses renseigne ainsi sur la nature de la mmoire smantique (Meyer, 1976).
4.1. Les modles en rseaux

4.1.1. Collins & Quillian (1969, 1970)
Lun des modles les plus clbres de lorganisation de la mmoire smantique a t propos par Collins & Quillian en (1969). Leur conception, grandement inspire des perspectives de la thorie de linformation (Shannon & Weaver, 1949), fait suite aux travaux de Quillian (1968, 1969). Cet informaticien sest intress la comprhension de langlais crit et a formalis un modle de stockage de linformation smantique semblable aux modlisations informatiques dalors.
La mmoire
109
Selon Quillian, les connaissances sont reprsentes sous la forme d'un rseau hirarchique constitu de nuds relis entre eux. Les nuds peuvent tre tiquets par des mots. Au sein du rseau, ces nuds sont relis par des arcs associatifs correspondant diffrents types de relation. Quand larc relie chaque nud ou concept un surordonn immdiat il dtermine en ce cas une relation de surordination (exemple, poisson animal). Quand larc dcrit une proprit ou une caractristique du concept (exemple, peut voler ), on parle de lien de subordination. Qualifie de modle hirarchique, cette conception de la mmoire de Collins & Quillian prsente une organisation de linformation en mmoire reposant sur des principes de hirarchie catgorielle et dconomie cognitive. De plus, les auteurs proposent de sparer le lexique de la mmoire smantique. Selon eux, la mmoire smantique ne stocke que la signification des mots, la mmoire lexicale conservant les informations de type morphologique des mots. Dans leur paradigme, les auteurs utilisent la mesure des temps de raction des preuves de dcisions smantiques dnoncs. Selon leur modle, le temps de raction dun sujet correspond au temps que ce sujet met rcuprer linformation en mmoire pour dcider de lexactitude ou non de la proposition. Cette indication du temps de rponse est trs importante et est lie la notion de distance smantique chez les auteurs. Prenons lexemple du canari. Dans ce modle hirarchique, la proprit est jaune est subordonne canari car tous les oiseaux ne possdent pas cette caractristique. A contrario, la caractristique a des plumes est subordonne oiseaux car tous les membres de cette catgorie possde cette proprit. Dans la proposition un canari est jaune , Collins & Quillian prdisent que le temps de dcision sera plus court que pour la proposition un canari a des plumes . En effet, selon cette ide de distance smantique, le temps de vrification de la phrase dpend du nombre darcs associatifs franchir au travers du rseau smantique (Cf. Figure 11).
La mmoire
110
Figure 11
Exemple dorganisation hirarchique de la mmoire smantique, daprs Collins & Quillian (1969)
a de la peau mange respire nage a des branchies
Animal
Oiseau
a des ailes peut voler a des plumes
Poisson
Canari chante est jaune
Autruche
Requin est grande
Saumon dangereux mord rose comestible
Si les rsultats de Collins et Quillian sont valids pour les propositions exactes, leur modle dune mmoire en rseau fonctionnant sur les principes de hirarchie catgorielle et dconomie cognitive a montr des difficults dans linterprtation des propositions fausses (Anderson & Reder, 1974). Schaeffer & Wallace (1970) se sont intresss au problme de la vrification dnoncs concernant les propositions fausses et linfluence de la similarit smantique sur le temps de jugement (Schaeffer & Wallace, 1969). Ils ont mis des critiques sur lincapacit de la modlisation de Collins & Quillian rendre compte de temps de raction trs courts pour des instances trs distantes dans le rseau smantique. Une autre attaque de cette conception vient de Conrad (1972) et dAnderson & Bower (1973). Pour eux, cest le principe mme dconomie cognitive qui est rfuter car il faut admettre une certaine redondance dans la structure de la mmoire. Ces chercheurs envisagent la possibilit que des proprits et mme des exemplaires de catgories soient stocks avec plusieurs concepts de niveaux diffrents.
La mmoire
111
De nombreuses critiques dont celles des ensemblistes (Meyer, 1970 ; Schaeffer & Wallace, 1969, 1970 ; Smith, Shoben & Rips, 1974) feront voluer ce modle vers une nouvelle formalisation en 1975.
4.1.2. Collins & Loftus (1975)

En 1975, Collins & Loftus proposent donc un second modle de la mmoire smantique, le modle de la diffusion de lactivation (cf. Figure 12). Pour tenter de rendre compte des critiques formules sur les temps de raction plus brefs pour certaines instances, les deux chercheurs ont labor un modle moins rigide que le prcdent. Ici, en effet, la structure du modle en rseau est plus souple et remet en cause la notion de hirarchie caractrisant le modle de Collins & Quillian (1969). Collins & Loftus ont galement complt leur modle en ajoutant aux relations dinclusion (est un) ou aux relations dattribution de proprit (possde un) des liaisons exprimant une relation de non-inclusion entre deux concepts. Cet ajout rpond la difficult dinterprtation des temps de raction trs brefs souvent constater pour les propositions fausses. La modlisation des deux chercheurs intgre les notions de distance smantique et de relation smantique. Dans un sens large, la relation smantique est la plus ou moins grande proximit entre les significations de deux concepts ou dun concept et d'une proprit. Si plusieurs concepts peuvent tre qualifis par une mme proprit, on peut concevoir une liaison entre ces concepts via cette proprit commune. Ainsi, la caractristique d'tre rouge s'appliquant la fois fleurs et pommes, il existe au minimum un chemin constitu de liaisons associatives entre ces nuds du rseau.
La mmoire
112
Figure 12
Reprsentation de la relation smantique existant entre quelques concepts, d'aprs Collins et Loftus (1975) - une ligne courte exprime une relation plus forte
rue voiture
vhicule car camion
ambulance voiture de pompier maison orange jaune vert violettes roses fleurs lever de soleil coucher de soleil nuages cerises poires feu rouge pommes
Il en dcoule que toutes les liaisons ne sont pas quivalentes entre elles : la force de ces liaisons dpend de la force associative entre deux concepts. Au niveau des jugements sur les propositions, le nombre darcs associatifs franchir et la force de chaque liaison dtermi nent le temps ncessaire la dcision du sujet. Le mcanisme daccs linformation est celui dune diffusion de lactivation dans le rseau associatif. Cest pourquoi le temps de rcupration en mmoire sera dautant plus court que les concepts possdent entre eux beaucoup de caractristiques communes et de relations associatives.
La mmoire
113
Ce modle a permis de rendre compte notamment des rsultats de certaines preuves de production o le nom dun concept doit obir une double contrainte : appartenance une catgorie donne et possession dune qualit particulire (Freedman & Loftus, 1971).
4.2. Les modles de comparaison par traits

Les modles ensemblistes (Meyer, 1970, 1973, 1975, 1976 ; Schaeffer & Wallace, 1969, 1970 ; Smith, Shoben & Rips, 1974) sont apparus la mme poque que les modles hirarchiques que nous venons dexposer. Ils se sont dvelopps en formulant de nouvelles notions pour rendre compte de la structure particulire de la mmoire smantique.
4.2.1. Meyer (1970)

Les considrations de Meyer se sont labores petit petit au dbut des annes 70 aux travers de diffrentes recherches exprimentales (Meyer, 1970, 1973, 1975, 1976). Pour lauteur, plusieurs types d'informations concernant les catgories smantiques sont stocks en mmoire. Sont mmoriss plusieurs lments tels que les exemplaires ou instances des catgories, les attributs dfinitionnels (proprits que possdent les membres dune mme catgorie) mais aussi des relations entre les catgories (surordination et subordination). Mme si les lments entre eux ne prsentent pas la mme accessibilit, il nexiste pas de structure particulire pour ces ensembles dinformations. La comprhension des phrases ncessite la rcupration d'une partie ou de la totalit de ces informations disponibles. Cette rcupration sopre par une recherche dans les ensembles dlments en fonction de la tche effectuer. Dans ses preuves de catgorisation, Meyer demande aux sujets de juger de lexactitude dnoncs du type les C1 sont des C2 avec deux types de phrases utilisant les adjectifs de quantification all (tous ou toutes) et some (certains ou certaines). L'examen des temps de raction indique que la comprhension des noncs dpend de linteraction de plusieurs
La mmoire
114
facteurs pour cette recherche en mmoire : la taille des catgories (Landauer & Meyer, 1972), la nature de la relation entre les catgories C1 et C2, ainsi que le type de phrases proposs. Sur cette importance de la taille de la catgorie, nombre dtudes indiquent quil faut moins de temps pour dcider quun exemplaire appartient une catgorie quand celle-ci est de petite taille que lorsquelle est de grande taille (Collins & Quillian, 1969, 1970 ; Meyer, 1970). Toutefois, dautres chercheurs ont constat des effets inverses observant des temps rapides de dcision pour de grandes catgories (Smith, Shoben & Rips, 1974).
4.2.2. Smith, Shoben & Rips (1974)

Voisine de la conception de Meyer, le modle de Smith, Shoben & Rips (1974) intgre un certain nombre de donnes exprimentales relatives la vitesse de jugement des relations entre deux concepts. Les auteurs observent en effet que pour certains noncs dune mme catgorie les sujets mettent plus de temps rpondre (exemple, dcider que un poussin est un oiseau prend plus de temps que de juger la proposition un canari est un oiseau ). values par la suite dans une preuve indpendante, ces instances plus rapides sont galement juges plus typiques des catgories utilises. Cela a conduit les auteurs sintresser la reprsentativit ou typicalit (Rosch, 1973, Cf. page 115) des instances en mmoire smantique. Dans leur modle, la signification dun mot peut tre analysable selon un ensemble de traits smantiques (ou smes, Le Ny, 1976). Ces traits sopposent entre traits dfinitoires lments absolument ncessaires la dfinition et traits particuliers traits de moindre importance car plus occasionnels pour la dfinition (Lakoff, 1972). Pour Rips, Shoben & Smith (1973), la reprsentativit dune instance est fonction de ces traits particuliers car ils permettent seuls de diffrencier des instances au sein de leur catgorie. La recherche de
La mmoire
115
linformation en mmoire est considre comme un double processus de comparaison (Smith, Shoben & Rips, 1974). Dans les activits de vrification dnoncs, la rcupration de linformation utile en mmoire se fait en deux tapes. Lors de la premire, le sujet rcupre les ensembles de traits pour la catgorie et linstance de la proposition. En comparant globalement les deux ensembles, une mesure de similarit est alors donne autorisant une rapide rponse ngative si la similarit nest pas acceptable. La seconde tape compare uniquement les traits dfinitoires et prend plus de temps que ltape prcdente. Aussi la dure de jugement dun nonc est fonction du recours ncessaire ou non cette seconde tape de vrification. Notions de typicalit et de prototype Les diffrents modles que nous venons dexaminer ont voqu plusieurs notions dont celle de typicalit des instances. Voyons cette notion ainsi que celle de prototype qui lui est proche. Beaucoup dauteurs ont indiqu que la typicalit (Rosch, 1973) dun exemplaire avait un effet sur le temps de dcision pour les propositions vraies : en effet, la vrification dune instance trs typique est plus rapide quune instance peu typique (Rips & coll., 1973 ; Smith & coll., 1974 ; Rosch, 1973 ; Wilkins, 1971). Pour Degouys (1994), cet effet de la typicalit dun exemplaire sur le temps de rponse est proche de leffet de la force de la relation smantique entre instance et catgorie (Collins & Loftus, 1975). Pour un point rcent sur la notion de typicalit, confre Postal, 1997. Quant au modle prototypique de la catgorisation, il est sensiblement diffrent de la seule notion de typicalit des instances. Des expriences tablissent que tous les membres des catgories constitues ne sont pas quivalents, certains objets tant de meilleurs exemplaires que dautres (Rosch, 1977 ; Rosch & Mervis, 1975 ; Rosch, Mervis, Gray, Johnson & Boyes-
La mmoire
116
Braem, 1976). Dans la catgorie oiseaux, le rouge-gorge ou le moineau sont de meilleurs reprsentants que lautruche ou le pingouin. Le meilleur exemplaire est appel prototype et cest autour de lui que sorganise toute la catgorie. Dans cette perspective, les membres dune catgorie sont regroups selon une chelle de typicalit (ressemblance plus ou moins forte avec le prototype) et non sur la base dun ensemble de proprits que tous partagent ncessairement.
4.3. Vers des modlisations mixtes

Ces conceptions en rseaux et ensemblistes, bien quopposes, ne sont pas forcment incompatibles entre elles (Hollan, 1975 ; Chang, 1986). La thorie des scripts (Schank & Abelson, 1977 ; Abbott, Black & Smith, 1985 ; Yekovich & Walker, 1986) mixte en effet ces deux positions. En 1977, Schank & Abelson ont caractris une structure de connaissances appele script. Les scripts ou scnarios sont une reprsentation de connaissances propos dvnements utiliss trs frquemment. Cette utilisation au quotidien dvnements fait que les scripts ont un fonctionnement trs strotyp. Bower, Black & Turner (1979) dcrivent les scripts comme des ensembles ordonns dactions. A lintrieur de ces ensembles ordonns, les actions se regroupent dans des sous-ensembles (notion de scne chez Schank & Abelson, 1977) dont les interrelations sont trs proches. Dans cette perspective, les connaissances sont reprsentes sous la forme dun rseau smantique sur le modle de Collins & Loftus (1975). Limportance dun concept dans le script dtermine le niveau dactivation des nuds utiles au traitement de la tche. Les liens qui relient les diffrents concepts entre eux sont tablis en fonction de la typicalit de leurs relations.
La mmoire
117
5. L A MMOIRE ENCYCLOPDIQUE
5.1. Dfinition et origine de cette notion
Quotidiennement notre mmoire non seulement senrichit dinformations nouvelles mais complte ou remanie des connaissances antrieures. Alors que la mmoire court terme, nous le disions, est caractrise par une capacit limite (Miller, 1956 ; Tulving, 1972) et un oubli massif et rapide (Murdock, 1962), la mmoire long terme possde un stock immense de connaissances soumis un oubli plus progressif. Pour qualifier ces connaissances en mmoire long terme, Lieury a propos le terme de mmoire encyclopdique (Lieury, 1992b ; Lieury & coll., 1995a, 1995b). Cette notion se rfre en effet au stock de connaissances emmagasines en mmoire long terme. Elle exprime lorganisation, la varit et ltendue des connaissances lexicales et smantiques quun individu acquire tout au long de son existence. En fait, ce terme de mmoire encyclopdique prend son origine dans lintrt des travaux de Lieury sur les liens quentretiennent les tests de raisonnements et la russite scolaire (Lieury, 1993b). Dans la littrature, une conception de Spearman remontant au dbut du sicle veut que lintelligence soit un facteur gnral de type raisonnement. Aussi, les tests de raisonnement sont souvent vus comme de bons prdicteurs de la russite scolaire. Or les tudes de validit nindiquent que des corrlations modestes de lordre de .40, parfois moins encore, avec certaines disciplines scolaires. Ainsi, NGuyen Xuang en 1969 a mis en relation 15 tests de raisonnement avec les matires scolaires chez des lves de 5 me et de 3me. Si les corrlations sont stables, lauteur observe que celles-ci sont modestes, une corrlation notable (.40) apparaissant entre les mathmatiques et le raisonnement.
La mmoire
118
Des recherches plus rcentes ont confirm ces rsultats. En 1987, Aubret a compar la validit prdictive de tests et dapprciations scolaires au moyen dune vaste tude longitudinale auprs de 1 053 garons et filles suivis de la 3me au baccalaurat. Il apparat quune apprciation scolaire globale (moyenne scolaire) en 3me se montre le meilleur prdicteur de la progression au lyce et de la russite au baccalaurat (corrlation de .60 entre apprciation et niveaux dorientation scolaire), devant lapprciation des mathmatiques (.51) et celle du franais (.49). Le test de Spearman nobtient quune corrlation modeste avec .30. Le raisonnement, ici, ne prdit que partiellement la russite ultrieure, la motivation subjective mesure par deux questionnaires dintrts (littraire et scientifique) le prdisant encore moins. Ltude de Jensen & Reynolds (1982), cite par Lieury (1993b) et Etessamipour (1995) donne des rsultats intressants sur le lien existant entre vocabulaire et arithmtique. Ces auteurs amricains ont procd diffrentes analyses sur les rsultats des 1 868 enfants blancs de 6 16 ans employs pour la standardisation du WISC (Wechsler Intelligence Scale for Children). La comparaison entre vocabulaire et arithmtique fait apparatre que le test de vocabulaire (dfinition de mots de difficult croissante) est fortement corrl .72 avec le facteur G. La corrlation entre le test de raisonnement arithmtique (problmes arithmtiques galement de difficult croissante) et le facteur gnral est moindre avec .57. Pareillement, le test dinformation est aussi mieux corrl avec le facteur G (.67) que larithmtique. La conclusion de Lieury (1993b) et Etessamipour (1995) partir de ces rsultats est que les tests de vocabulaire et dinformations sont de meilleurs indicateurs de la russite gnrale au test global. Ces deux tests reprsentent mieux lintelligence gnrale telle que le W ISC la mesure. Cest donc un chec relatif des tests de raisonnement prdire la russite scolaire.
La mmoire
119
5.2. Connaissances encyclopdiques scolaires

A linverse, les implications de la mmoire dans les acquisitions scolaires ne sont pas autant examines que les tests de raisonnement. Gnralement, on considre que la russite scolaire est lexpression de lintelligence, les capacits dapprentissage paraissant secondaires dans cette russite. Aussi, les tests de mmoire sont souvent anciens et ne fournissent des mesures quassez lointaines par rapport aux connaissances scolaires. Ltude longitudinale de Lieury et de ses collaborateurs que nous avons appele vocabulaire technique du collge franais montre limportance de la mmoire encyclopdique dans ce domaine.
5.2.1. Importance du raisonnement et de la mmoire

Comme dautres travaux (notamment Burt & Vernon, 1965), les rsultats de ltude longitudinale indiquent que les matires scolaires sont relativement bien corrles entre elles11 alors que le raisonnement prdit peu la russite scolaire. Des corrlations, calcules entre plusieurs tests de raisonnement et les notes scolaires pour la 5me de collge (Lieury, 1991), mettent cela en vidence. Ainsi, le test de raisonnement gnral du D. 70 nest corrl qu .50 avec le total des matires scolaires. Certes, le raisonnement est important mais prdit plus modestement la russite scolaire que les tests de mmoire encyclopdique. Ceux-ci, par la mthode des questionnaires choix multiples (QCM), se montrent extrmement bien corrls avec les notes scolaires, rhabilitant lhypothse dune prgnance particulire de la mmoire dans les acquisitions et surtout la russite scolaire. Le total des Russites - Erreurs est corrl .72 avec le total scolaire de la 5e. Ce score R-E correspond la russite gnrale aux tests de vocabulaire minore des erreurs rencontres (ce score est en effet mieux corrl que le seul score des russites).
11
Selon Burt & Vernon (1965), les corrlations les plus faibles sobservent entre la moyenne gnrale et le travail manuel (.32) ainsi quentre la moyenne gnrale et le dessin (.27).
La mmoire
120
Comme Lieury le fait remarquer, si la mmoire a t nglige, cela le fut en raison de tests restrictifs ne mesurant que la mmoire court terme ou quelques mots seulement de vocabulaire (Lieury & coll., 1992a). Toutefois, gardons-nous de ngliger le rle de lintelligence pour affirmer un primat de la mmoire dans la russite scolaire, car les connaissances seules ne suffisent pas.
5.2.2. Le vocabulaire des manuels scolaires

Comme nous lindiquions dans le chapitre consacr au vocabulaire, les travaux sur les connaissances encyclopdiques se sont tout dabord intresss au terrain scolaire. Le collge, avec ses disciplines aux domaines de savoirs bien spcifiques, est le lieu privilgi dun enseignement portant sur une grande varit de concepts. De plus, ces disciplines scolaires permettent de voir si ces connaissances encyclopdiques particulires ont une incidence sur les notes scolaires des lves. Aussi, par rapport lcole primaire, le postulat de Lieury a t quau collge, les disciplines sont beaucoup plus marques et autonomes. De ce fait, elles dispensent des savoirs techniques spcifiques venant complter le vocabulaire courant enseign jusquen CM2. Le vocabulaire nouveau vu au collge prend donc le sens de vocabulaire technique spcifique une matire scolaire. Grce aux concours dtudiants en Psychologie, tout mot non prsent dans le vocabulaire de base du Dottrens & Massarenti (2 716 termes) a t relev comme mot technique de la matire. Pour chaque discipline, louvrage scolaire en usage au collge a servi de rfrence pour la matire tudie12.
12
Le manuel scolaire est en effet le plus petit dnominateur commun entre les diffrents ens eignants dune mme matire : il eut t matriellement difficile de recueillir les cours de chaque enseignant pour le programme dune anne scolaire. Ce choix rejoint celui de Nagy & Anderson (1984).
La mmoire
121
Le Tableau 10 recense linventaire du vocabulaire technique sur les quatre annes du collge. Dans ce tableau, il na pas t tenu compte des mots en commun dune anne sur lautre que ce soit pour une mme discipline ou pour lensemble des matires. On ne peut que constater sur ces annes une croissance dramatique du vocabulaire de rfrence dans les manuels obligatoires : si lobjectif est denviron 6 300 mots en 6me, il passe prs de 24 000 mots en fin de 3me, ce qui est considrable. Par ailleurs, les disparits entre matires sont galement trs grandes. Tableau 10 Inventaire du vocabulaire technique de la 6me et de la 3me (rpartitions par matire), daprs Lieury (1996) Matires scolaires Franais .................................... Histoire ..................................... ducation civique ..................... Gographie ............................... Anglais ..................................... Biologie (Gologie en 4me) ..... Physique Chimie ................... Mathmatiques ......................... Total des manuels * 6me 1 989 1 088 872 824 716 402 259 167 6 317 * 5me 2 692 2 841 421 1 370 1 164 776 212 203 9 679 * 4me 5 379 3 257 1 646 2 636 2 354 1 099 1 131 571 18 073* 3me 7 049 6 722 2 917 ** 2 272 2 456 2 133 440 23 989*
Ces totaux nincluent pas les autres langues vivantes, les lves tudiant plus de 96 % la langue anglaise.
**
En 3me, les programmes dhistoire et de gographie tant trs proches, un inventaire commun a t ralis.
5.2.3. valuation des connaissances encyclopdiques scolaires

Le vocabulaire technique a donc t examin en dtail sur les quatre annes que compte le collge franais au travers dun grand nombre de QCM (100 par matire). Ces 800 QCM relatifs au franais, aux mathmatiques, lhistoire, la gographie, langlais, la biologie
La mmoire
122
et la gologie, ainsi qu la physique et la chimie ont t administrs une mme cohorte dlves. Avec le concours du collge des Hautes Ourmes, prs de 200 lves ont t suivis de la 6me la 3me jusquau Brevet des collges. Les passations se sont droules la fin de chaque anne scolaire afin de couvrir tout le programme annuel. Pour illustrer les rsultats, nous reprendrons le mme graphique (Cf. Figure 13) de lestimation du vocabulaire encyclopdique de la 6me la 3me en fin danne scolaire, dj prsent page 52 dans le chapitre sur le vocabulaire. Sur cette figure, le pourcentage de russite aux QCM a t rapport au nombre de mots des matires. Cela fournit une estimation des acquis des lves, sur le plan lexical et smantique. Figure 13 Estimation du vocabulaire encyclopdique de la 6me la 3me en fin danne scolaire, daprs Lieury, Van Acker & Durand, 1995b
24000 22000 20000 18000 16000 14000 Estimation 12000 mots acquis 10000 8000 6000 4000 2000 0 base 6me 5me 4me 3me total manuels Moyenne note la plus leve note la plus basse
Niveau scolaire
Le graphique nous permet dobserver une augmentation croissante des acquis scolaires pour les quatre annes du collge. Bien que non constant, le rythme dacquisition parat doubler chaque anne. Alors que lestimation moyenne est de 2 500 mots en 6me (n = 190 lves ; Lieury, 1993b), elle grimpe 5 000 mots au niveau 5me (n = 212 ; Lieury &
La mmoire
123
coll., 1992a, 1992b), environ 11 500 mots en 4me (n = 417 ; Lieury & coll., 1995a) et prs de 17 000 concepts en fin de 3me (n = 174 ; Lieury & coll., 1995b). Pourtant, si le stock de connaissances de chaque lve progresse sur les quatre annes, de grandes disparits apparaissent entre les lves. En 6me, lcart entre llve ayant le mieux russi les QCM et son camarade ayant les rponses les plus faibles est estim environ 3 000 mots techniques. En 3me, en reprenant la meilleure estimation de vocabulaire et la plus faible, lcart entre les deux stocks de connaissances est encore plus considrable : plus de 10 000 mots sparent ces deux lves (Lieury & coll., 1995b) ! Ces rsultats sont congruents avec leffet Mathieu (Stanovich, 1986). Lieury remarque que les lves ayant le plus de vocabulaire sont aussi ceux qui ont les meilleures moyennes gnrales au total des matires. Les analyses portes sur ces rsultats mettent en vidence que la mesure de la mmoire encyclopdique, exprime par le score Russites Erreurs (R-E), est fortement corrle avec la moyenne gnrale annuelle des lves. En 6me, ce rsum annuel des notes scolaires est corrl .60 avec le score R-E pour un effectif de 190 lves. Il lest .72 en 5me (n = 138), .59 dans les classes de 4me (n = 147) et .61 dans la dernire anne du collge (n = 174). Ce mme score R-E explique 41 % de la variance des rsultats au Brevet des collges (r = .64 ; n = 174). On constate que ces corrlations sont plus importantes que celle obtenue entre le test de raisonnement du D. 70 voqu plus haut (.50 avec la moyenne gnrale en 5me ; Lieury, 1991). Pourtant, ce score du D. 70 est lgrement suprieur aux corrlations releves par NGuyen Xuang (1969) et Aubret (1987) pour dautres tests de raisonnements sur des effectifs plus nombreux. Ici, la mesure de la mmoire encyclopdique au collge marque donc le pas sur les tests de raisonnement classiques.
La mmoire
124
En 1996, Lieury a prsent un rsum de cette tude longitudinale du vocabulaire technique au collge et donn quelques conclusions cette mmoire encyclopdique apprhende sur le versant scolaire. Pour cela, il a tent dvaluer le devenir scolaire des lves partir de la mesure des connaissances encyclopdiques en fin de 6me. Lieury sest inspir des cinq niveaux dorientation scolaires aprs la 3me dAubret (1987). En faisant un suivi transversal des lves et non plus longitudinal13, lauteur a labor une chelle en huit points du devenir scolaire. Les niveaux 1, 2 et 3 correspondent respectivement des lves redoublant en 6 me, 5me et 4me. Quant aux niveaux de 4 8, il sagit des lves ayant poursuivi leur scolarit sans redoublements. Ces quatre derniers niveaux sont fonction de la moyenne obtenue lpreuve du Brevet des collges pour les trois preuves spcifiques (histoire gographie, franais et mathmatiques). Un lve class niveau 4 selon lchelle de Lieury a obtenu une moyenne au Brevet infrieure 7,5 / 20. Le niveau 5 est donn entre 7,5 et 10 / 20 non inclus, le niveau 6 entre 10 et 12,5 / 20 non inclus, le niveau 7 quand llve a obtenu une moyenne infrieure 15 / 20 et enfin le niveau 8 lorsque la moyenne est suprieure 15 / 20. La Figure 14 prsente de manire rtrospective la capacit de la mmoire encyclopdique des lves en fin de 6me daprs leur devenir scolaire. Ici la notion de capacit exprime ltendue et la qualit des apprentissages scolaires en mmoire long terme, et non un potentiel fig (Lieury, 1996). Ce graphique rsume plusieurs observations. Premirement, les lves qui ont redoubl dans leur cursus avaient rtrospectivement un vocabulaire infrieur la moyenne des 2 500 mots au test de vocabulaire de 6me. Deuximement, on constate que la russite au Brevet (gradation des notes du niveau 4 au niveau 8) est fonction du stock de connaissances encyclopdiques ds la fin de la 6me. Plus un
13
En raison de redoublements et autres dmnagements, il na t possible de suivre tous les lves de la cohorte de 6me pendant ces quatre ans.
La mmoire
125
lve dispose de vocabulaire au sortir de la 6me et mieux il est arm pour en acqurir dautres et russir son Brevet. Les rsultats de Lieury (1996) montrent que ds la 6me le score de mmoire encyclopdique qui est fortement corrl avec la moyenne gnrale en fin de 6me (r = .712) parat aussi tre un bon prdicteur du devenir scolaire au Brevet (r = .714 ; effectif de 162 lves, incluant 51 redoublants14). Toutefois, le meilleur prdicteur du devenir scolaire demeure la moyenne en fin de 6me (r = .849), comme la relev Aubret en 1987.
Figure 14
Capacit rtrospective de la mmoire encyclopdique (mesure par le vocabulaire spcifique de la 6me) correspondant au devenir scolaire, Lieury (1996).
4000 3500 3000 2500 2000 1500 1 2 3 4 5 6 7 Devenir scolaire jusqu'au Brevet 8
Rsultats au Brevet Redoublants 5e 6e 4e
Vocabulaire en fin de 6me
14
Attentif au biais que peut induire lincorporation des redoublants, Lieury a retir ceux-ci du calcul de la corrlation entre le score de mmoire encyclopdique et la moyenne au Brevet. La corrlation tombe .584 pour un effectif de 111 lves, au lieu de .714 (n = 162).
La mmoire
126
5.3. Connaissances encyclopdiques extra -scolaires et norme de frquence

Dans sa premire dfinition (Lieury & coll., 1995a, 1995b ; Etessamipour, 1995), cette mmoire encyclopdique ne sintressait quaux seules connaissances spcifiques de lenseignement scolaire : elle tait dfinie comme le stockage du vocabulaire conceptuel des matires scolaires (Lieury & coll. 1995b). Trs rcemment, cette notion de mmoire encyclopdique a t complte en intgrant certaines considrations sur des connaissances encyclopdiques extra-scolaires (Postal, 1997 ; Postal, Dro & Lieury, 1996 ; Postal & Lieury, 1997). Il est vident que le comptage du vocabulaire ne fournit quune indication globale de la richesse des connaissances en mmoire. En sintressant lorganisation de ces savoirs, on peut obtenir dautres renseignements utiles sur la mmoire encyclopdique.
5.3.1. Savoirs scolaires et extra -scolaires

Jusqualors, les travaux de Lieury ont examin la mmoire encyclopdique en tudiant uniquement les connaissances encyclopdiques scolaires. Les recherches de Postal & Lieury (1997) se veulent plus vastes. En tudiant les savoirs scolaires et des savoirs non scolaires (cinma, musique, sport, etc.), les auteurs tentent de considrer la mmoire encyclopdique dans sa globalit. Leur premier objectif est dvaluer la richesse du savoir encyclopdique chez des adolescents et dapprhender lorganisation de leurs connaissances. Le second objectif est de rapprocher ce savoir encyclopdique avec les indicateurs classiques des valuations scolaires : la moyenne gnrale et les performances un test de vocabulaire. Ainsi, les deux auteurs font la distinction entre connaissances encyclopdiques scolaires et extra-scolaires. Pour cela, les auteurs ont conu un test de connaissances encyclopdiques interrogeant une grande varit de domaines de savoirs. Ce test est bas sur lextraction partir du Quid (1993) de 120 catgories de connaissances (supercatgories et sous-catgories). Un carnet de
La mmoire
127
120 catgories a t mis ralis et soumis 86 lves de 3me de ltude longitudinale du collge franais. La consigne donne est de fournir le maximum dinstances (noms propres ou noms communs) se rattachant aux catgories proposes, dans la limite de 8 exemplaires par catgorie. Si aucune limite de temps nest donne, lpreuve dans son ensemble nexcde pas deux heures. Ltendue des connaissances est apprcie par le nombre dexemplaires cits et la composante smantique lest par la production dinstances catgorielles. Par ailleurs, un autre test de vocabulaire est utilis, celui de Binois & Pichot (1958). Dans ce test papiercrayon de 44 mots, les sujets doivent trouver pour chaque item son synonyme parmi six propositions. Le Binois-Pichot sert mesurer ltendue du vocabulaire la disposition des 86 lves. Il est corrl .71 avec le facteur G intelligence gnrale et .46 avec le facteur V aptitude verbale (Binois & Pichot, 1958). Dans les productions catgorielles, les rsultats montrent que les lves produisent en moyenne plus de 620 mots (cart-type de 100) soit 64,7 % des 960 cases disponibles du carnet (120 catgories 8 rponses maximums). Ces chiffres montrent bien la capacit considrable
de notre mmoire encyclopdique dans cette preuve de rappel indic des connaissances. Un regroupement des seules 79 catgories discriminantes15 a t opr en 14 supercatgories allant pour la plupart dans le sens dune distinction savoir scientifique / savoir littraire. Une analyse factorielle met en vidence quatre facteurs correspondant lorganisation des connaissances encyclopdiques. Si les deux premiers facteurs se dgagent bien les deux autres sont plus flous. Le premier nomm connaissances scolaires est fortement satur avec les sciences naturelles, les sciences et lhistoire - gographie. Le second facteur se rfre aux loisirs sportifs , le troisime tant un facteur culture gnrale (musique et cinma). Le dernier facteur, la culture gnrale , est relatif aux arts et la littrature.
15
41 catgories non discriminantes (effet plafond des rponses ou pas de rponses) ont t limines des analyses.
La mmoire
128
Les auteurs ont examin les implications de ces connaissances encyclopdiques dans la russite scolaire. Les corrlations releves sont en fait modres entre lpreuve des 120 catgories et les notes scolaires (de .30 .40). Toutefois, il est possible quun lve ait de faibles rsultats scolaires alors quil possde une quantit de connaissances extra-scolaires consquentes, linverse tant tout autant possible. Par ailleurs, les auteurs constatent que ces connaissances extra-scolaires sont modestement corrles avec la mmoire encyclopdique scolaire (QCM de ltude longitudinale). Les corrlations vont de .35 .41. Enfin, la liaison entre le test du Binois-Pichot et les 120 catgories interroges tant faible (r = .30), Postal & Lieury (1997) indiquent que ltendue du vocabulaire courant la disposition du sujet ne dtermine pas la quantit de savoir encyclopdique. La conclusion des auteurs est que cette mesure des connaissances encyclopdiques extra-scolaires ne peut elle seule prdire la russite scolaire dun lve. Ils constatent tout au plus que la quantit de savoir littraire est le plus en rapport avec la moyenne gnrale des lves.
5.3.2. Normes de frquence de 221 cat gories

Si les expriences portant sur les catgories de connaissances sont nombreuses, elles emploient classiquement des catgories usuelles telles que les fruits, les oiseaux ou les professions (exemples pris dans les normes de Charles & Tardieu, 1977). Celles-ci ont en fait t apprises ds lenfance (Anderson & Reder, 1974). Pourtant la connaissance catgorielle est beaucoup plus tendue (Postal & coll., 1996). Elle couvre vraisemblablement des centaines de catgories diffrentes. Postal, Dro & Lieury (1996) ont construit une table de frquence des connaissances encyclopdiques. La signification ici de ces connaissances dpasse les seuls savoirs scolaires et inclut des savoirs non scolaires comme dans ltude de Postal & Lieury (1997).
La mmoire
129
Gnralement, les normes existantes se limitent aux catgories usuelles et aux noms communs. La prsente tude contient non seulement des noms communs mais aussi des noms propres. Lobjectif principal de cette recherche est ici aussi de dcouvrir les indices dune organisation des connaissances partir de ces normes de productions catgorielles. De la mme faon que pour le test de connaissances encyclopdiques prsent prcdemment (Postal & Lieury, 1997), les auteurs sont partis de linventaire des thmes du Quid (1993). Des 26 thmes majeurs de louvrage, 17 thmes ont t retenus, au sein desquels des catgories ont t slectionnes. Au final, la tche de production dinstances a port sur 221 catgories diffrentes. 224 tudiants en premire anne de DEUG de Psychologie ont particip la recherche. Au total, 3 390 instances diffrentes ont t produites. Dune manire gnrale, on retrouve les mmes exemplaires les plus frquents des normes de Charles & Tardieu dans ces nouvelles normes. Dans certaines catgories, un effet de gnration apparat notamment dans les productions de prnoms. En ce qui concerne la taille des catgories, le nombre moyen de mots est de 15. Mais les disparits sont grandes : certaines catgories dpassent facilement les 40 instances (prnoms masculins, titres de romans) alors que dautres possdent moins de 5 lments (astronautes, prsidents franais). Sur lensemble des rponses fournies, 14 % derreurs ont t releves. Elles sont majoritairement le fait derreurs de catgorisation mais encore de fautes dinattention, dimprcisions des rponses ou derreurs phonologiques. Si la rpartition des erreurs est quivalente entre les deux types de noms, les erreurs sont plus associer la spcificit ou lexpertise demande dans les catgories (Postal, 1997).
La mmoire
130
5.3.3. Appartenance catgorielle et temps de jugement smantique

Grce de ces normes de frquence de 221 catgories, Postal & coll. (1996) ont tent dexplorer plus avant les connaissances encyclopdiques par la technique des temps de jugement smantique. Pour cela, ils ont compar les noms communs et les noms propres en fonction de la distance smantique et de la frquence associative (Conrad, 1972). A linstar du modle en rseau de Collins & Quillian (1969), des relations hirarchiques sur deux niveaux ont t construites partir de 20 catgories (10 de noms propres et 10 de noms communs) choisies parmi les 221 des normes de frquence. La construction des arbres de connaissances croise mthodiquement effet de frquence et distance smantique. Les rsultats recueillis auprs de 20 sujets tudiants sont assez classiques. Ils montrent une diffrence dans les temps de raction entre les propositions vraies et les propositions fausses (Collins & Quillian, 1970 ; Chang, 1986 ; Schaeffer & Wallace, 1970) et un effet de la frquence. Leffet de la distance smantique, sil apparat, est rduit la diffrence entre D0 (distance nulle) et D1 (instance catgorie) qui reprsente un effet de la catgorie spcifique. Les analyses des temps de jugement ne rvlent pas deffet de supercatgorie (Collins & Quillian, 1969). Il semble vraisemblable que les catgories soient stockes comme des traits smantiques en fonction de leur frquence mais non en fonction dune hirarchie compltement logique (Smith & coll., 1974). Les comparaisons entre noms communs et noms propres ne marquent de diffrences que pour la distance D0 avec les noms propres frquents. Hormis cela, les deux types de noms ne diffrent ni par la frquence ni par la distance smantique. Lexamen des propositions fausses renvoie lui aussi des rsultats classiques : les temps de jugement augmentent en fonction de la proximit smantique et linverse se rduisent pour la distance D2 comme dans le cas des anomalies smantiques. Si cela est vrai pour les noms communs, on ne retrouve pas ces
La mmoire
131
rsultats pour les noms propres de frquence faible. Pour certains sujets, ces noms propres sont peut-tre tout simplement inconnus. Ce dernier cas fait apparatre la question du degr dexpertise des individus comme une variable supplmentaire dont il faut tenir compte, non dans les catgories usuelles (mmoire smantique) mais dans la varit des domaines de la mmoire encyclopdique.
5.4. Vers une expertise des connaissances

On dit dun expert dun domaine que ses performances dpassent celles de la moyenne de la population (Salthouse, 1991). Cependant il est difficile dadmettre que tous les experts aient les mmes performances. Aussi, le terme dexpertise nest employ que lorsque des comparaisons avec des niveaux de performances moindres sont menes dans un domaine bien dlimit. Les premiers travaux sur lexpertise se sont dabord intresss la mmorisation dchiquiers chez des joueurs dchecs (De Groot, 1965, cit par Chase & Simon, 1973). On a observ que chez les grands matres et matres dchec le rappel immdiat des positions dun chiquier, prsent de 2 10 secondes, est quasi parfait (93 % de rponses correctes des positions de 25 pices). Les experts, considrs comme infrieurs ces matres, obtiennent 72 % de rponses correctes contre seulement 50 % pour les amateurs et 30 % pour les novices (De Groot, 1965). Toutefois, quand les pices sont places au hasard, sans correspondance avec les rgles de placement, tous les joueurs ont les mmes performances, en de des rappels des novices lorsque lchiquier est organis : quelle que soit leur expertise, ils ne parviennent rappeler quenviron 3 4 pices correctement parmi les 25 (Simon & Chase, 1973). Si la capacit restituer correctement les positions des pices dpend du niveau dexpertise, elle dpend aussi de la vraisemblance de ces configurations.
La mmoire
132
Ces rsultats suggrent chez les experts lutilisation de meilleures stratgies de regroupement des informations de lchiquier par rapport aux novices. La mesure des temps de latence lors de la reconstruction des chiquiers par Simon & Chase (1973) met en vidence lemploi chez les grands matres de leurs connaissances antrieures. Ces positions des pices leur tant familires, les grands matres restituent en moyenne un nombre plus grand de chunks (7,7) contenant 3,8 lments : les amateurs ne rappellent que 5,7 chunks de 2,6 lments. Si les processus dorganisation lencodage des informations distinguent experts de non experts, ils peuvent aussi rendre compte des mmoires exceptionnelles (Chase & Ericsson, 1981 ; Ericsson & Polson, 1988). Lexamen du cas SF montre que par entranement on peut dvelopper des stratgies dorganisation particulirement efficaces dans une tche donne. Le sujet SF, un tudiant dans la moyenne, a pu augmenter considrablement ses performances dempan de chiffres et ainsi dpasser les individus ayant une mmoire prodigieuse (Ericsson, 1985). Pour cela, le sujet en question a suivi un entranement de 230 heures une tche dempan de chiffres. Il sest exerc pendant prs de deux ans, raison dune heure quotidienne trois quatre fois par semaine. Grce cela, son empan mnsique est pass de 6 80 chiffres. Le sujet a reconnu avoir dvelopp ds le deuxime jour dentranement des stratgies dorganisation. Les performances du sujet nont cess de crotre jusqu lempan de 80 au fur et mesure que celui-ci amliorait ses systmes de codage : de stratgies de regroupement simple, il est pass des mthodes mnmotechniques complexes utilisant des chronomtrages, des dates et des ges en rapport avec ses activits sportives extrieures. La supriorit des experts est donc bien le fait de stratgies trs efficaces dorganisation subjective des informations mmoriser (Tulving, 1972). Cela fait dire Ericsson & Chase quil nexiste pas de mmoire exceptionnelle mais des organisateurs exceptionnels (Ericsson, Krampe & Tesch-Rmer, 1993).
La mmoire
133
Les connaissances antrieures des sujets jouent donc un rle important dans la supriorit des experts. Comme Gaultney, Bjorklund & Schneider (1992) le montrent, les performances de rappel des experts et des novices sont quivalentes quand la liste de mots (catgories usuelles) mmoriser ne comporte aucun terme du domaine dexpertise (ici, le base-ball). De mme, avec le cas SF, quand la tche change de nature (empan de consonnes), les performances de ce sujet seffondrent et se rapprochent de la capacit mnsique normale de 7 lments (Miller, 1956). Cela dmontre que les experts ne sont suprieurs que dans leur domaine d'expertise. Pour ces connaissances expertes, Ericsson & Kintsch (1995) ont propos lide dune mmoire de travail long terme, drive de la dfinition de mmoire de travail court terme de Baddeley (1986). Cette mmoire de travail long terme ne sapplique quau domaine dexpertise : un expert nen dispose que dans son domaine, ses autres activits ny ayant pas recours. Laccs cette mmoire est maintenu temporairement via des indices de rcupration prsents en mmoire de travail court terme. Les experts acquirent ainsi des structures dencodage et de rcupration de linformation spcifique aux connaissances utilises. Cette conception nest pas sans rappeler celle de la mmoire fichier de Lieury (1992a). Les rsultats exprimentaux rcents de Postal (1997) semblent conforter cette hypothse dune mmoire de travail long terme spcifique un domaine dexpertise. Elle montre en effet que des enseignants du secondaire ( jeunes [moyenne de 48 ans] comme gs [retraits avec un ge moyen de 71 ans]) ont tendance rappeler plus ditems de leurs disciplines que ditems appartenant dautres matires. Ces expriences manipulent des connaissances encyclopdiques dans des tches dempan de lecture. Les performances dempan gnral et dempan non spcifique sont infrieures celles de lpreuve dempan spcifique. Lauteur constate par ailleurs que les sujets jeunes et gs conservent les mmes profils de capacit de mmoire dans leurs domaines dexpertise respectifs.
La mmoire
134
6. C ONCLUSION
Dans ce chapitre, nous avons montr que la mmoire est une notion extrmement complexe. Au moyen de diffrents processus, elle assure trois fonctions principales : la premire est la mmorisation des informations, la seconde concerne leur conservation et enfin la troisime autorise la restitution des informations stockes. Cest pourquoi il est difficile dadmettre que dans les tests de raisonnement les preuves de vocabulaire et dempan de mmoire court terme, prdictif par ailleurs du vieillissement normal ou pathologique, rendent bien compte de la mmoire dun lve dans sa globalit. Un autre argument est que les tudes de mmoire encyclopdique dmontrent que les connaissances dune personne ne sont pas rductibles aux seules acquisitions des catgories usuelles (mmoire smantique). La mmoire encyclopdique dun lve rassemble en effet des connaissances encyclopdiques scolaires et extra-scolaires. Si ces dernires sont moins importantes dans le devenir scolaire de llve, il est essentiel que celui-ci ait un stock consquent de vocabulaire technique des matires enseignes. Ds la 6me, son stock de connaissances lui permet de se constituer des ressources de connaissances qui vont faciliter et augmenter ces apprentissages conceptuels ultrieurs (1996). Ces rsultats sont congruents avec ceux de recherches antrieures sur limportance du vocabulaire dans le dveloppement mental ou de la comprhension en lecture (Beck & coll., 1982 ; Curtis, 1987 ; Nagy & Herman, 1987). Toutefois, la mmoire nest sans doute pas la seule en cause dans les performances scolaires. Dautres facteurs participent de ces performances. Par exemple, le facteur motivation est prgnant dans les stratgies dorganisation des connaissances en mmoire lors des apprentissages (Lieury & Fenouillet, 1996).
135
Chapitre 3 INVENTAIRES DU VOCABULAIRE DHISTOIRE 6 ME ET DU LEXIQUE DU PRIMAIRE
Inventaires dhistoire 6me et du lexique du primaire
136
Les ides, mme les plus sublimes, ne sont jamais inventer, elles se trouvent inscrites dans le vocabulaire consacr par l'usage. Alain, Histoire de mes penses, Gallimard.
1. P RLUDE AUX INVENTAIR ES

Initialement, lobjectif de cette thse ntait pas de rvaluer les inventaires du vocabulaire technique du collge franais (Lieury, 1991-1996) mais de complter les travaux autour de la mmoire encyclopdique scolaire. Nous avions en effet envisag dobserver de plus prs le rle des rptitions anaphoriques dans lacquisition de nouvelles connaissances en histoire. Les paragraphes qui suivent vont en fait servir de base de dpart notre interrogation sur la fiabilit du comptage manuel ralis lors de ltude longitudinale au collge (Dro, 1996). Pour cela, nous allons nous intresser certes lexprience en elle -mme mais surtout sur lexamen de donnes recueillies lors de la construction du matriel exprimental. Lexprience qui a t mene (Dro, 1994, non publi) sappuie sur un constat fait par Lieury (1992b) concernant les contenus des ouvrages scolaires au collge. Lauteur observe que, pour la plupart des nouvelles notions importantes dans le manuel dhistoire en 6 me (exemple, le mot Pharaon dans la leon sur lgypte), il y a peu doccurrences de ces mots techniques dans le corpus o ils apparaissent. Les concepts sont en fait, comme dans tout texte, voqus implicitement par lemploi danaphores, de pronoms ou dellipses.
137
La rptition implicite (nous dirons rptition smantique) nest donc pas le nombre de rencontres dun mot dans un texte mais le nombre de fois o ce mot est voqu. Pour pharaon, Lieury dnombre 22 faits dclaratifs y faisant rfrence pour seulement 8 occurrences. Lconomie empirique du remploi dun mme mot est une explication. Ds lors, un concept dont la forme lexicale est peu rpte nest pas un indicateur de sa frquence relle demploi dans un texte16. Or, les observer de plus prs, les manuels scolaires, en particulier celui dhistoire 6me, comportent de nombreuses rptitions smantiques. Nous pouvons alors penser quil existe des concepts bien plus frquents smantiquement que dautres dans les textes, et quil existe un lien avec la comprhension qui sen dgage. Pour cela, nous avons procd lexamen du corpus complet dune leon dhistoire en 6me relative lgypte. Cependant, linventaire de louvrage dhistoire du collge des Hautes Ourmes (Rennes) ayant t fait manuellement par des tudiants de Lieury, nous ne disposions pas des occurrences des mots. Aussi, avant de poursuivre, nous avons d procder la saisie informatique exhaustive de ce thme. Dans un premier temps les chapitres sur lgypte ont t ressaisis sans modification. Dans un second temps nous avons remplac toutes les substitutions par les mots dsigns. La comparaison des deux tables doccurrences gnres par le logiciel SPADT (Lebart & coll., 1988, 1994) nous indique quen gnral les occurrences les plus frquentes ont aussi les rptitions implicites les plus leves. Une exprience a t conduite pour vrifier si la rptition lexicale de faits dclaratifs importait dans lapprentissage de concepts nouveaux, en particulier chez des enfants possdant peu de vocabulaire du franais (lves orients dans des classes dinitiation). Trois classes de 6me ont particip lpreuve de comprhension : deux classes contrle sans
16
Rappelons que les concepts sapprennent notamment par labstraction de plusieurs pisodes. La rptition de nombreuses information pisodique (traits ou proprits du concept) permet labstraction du concept en mmoire (Cf. Lieury & Forest, 1994 ; Sternberg, 1987).
138
difficults (dont une venant dun tablissement utilisant un autre manuel dhistoire) et une classe dinitiation (lves majorit dorigine trangre). Lgypte nayant pas encore t aborde en cours, quatre notions (pharaon, temple, le Nil et scribe) de frquences lexicales et smantiques leves ont t choisies. Pour chaque notion, un texte contenant douze faits dclaratifs (12 pisodes de connaissances diffrents) a t construit. Nous navons pas effectu de dcoupages propositionnels complexes sur les faits dclaratifs comme le font les tudes classiques introduites par Kintsch sur lanalyse propositionnelle de la comprhension de texte (Rossi, 1989). Nous manipulons le nombre de rptitions du concept cible dans le texte (0, 3, 6 et 12 rptitions)17. La prsentation du texte lcran tait dune minute. Des QCM comprenant la bonne rponse et deux piges ont t administrs en pr-test et post-test pour les quatre concepts cibles. A la place dun clavier ordinaire, nous avons utilis un clavier exprimental disposant dun nombre rduit de touches pour limiter les mauvaises manipulations et avoir de meilleurs chronos. Les rsultats du pr-test montrent que les lves en scolarit ordinaire ont des connaissances antrieures satisfaisantes de ces mots dhistoire que la prsentation du texte amliore en post-test : les deux classes contrle, qui ne diffrent pas statistiquement entre elles, passent de 62 % 77 % de rponses correctes. Labsence de diffrences entre ces deux tablissements nous suggre que le choix des manuels scolaires comme rfrence du vocabulaire, prfr aux cours des enseignants, est judicieux. Il savre une bonne base pour lvaluation des connaissances scolaires. Les lves en classe dinitiation amliorent eux aussi leurs scores en passant de 35 % (rponses au hasard) 53 % de bonnes rponses. Si les erreurs lexicales sont aussi nombreuses entre les deux tests pour tous les lves, le nombre derreurs smantiques est notablement plus faible en scolarit normale. Toutefois, la variable
17
Avant chaque texte, la notion cible apparaissait au centre du moniteur informatique pendant quelques secondes la manire dun titre. Ensuite, lcran suivant prsentait le texte avec plus ou moins de rptitions du concept cible en fonction du contrebalancement opr.
139
rptition lexicale nintervient dans aucune des classes : le fait que les cibles aient t substitues ou non na pas eu dincidence sur la comprhension des textes. Exprimentalement, cette recherche se rvle insatisfaisante pour appuyer la distinction entre frquence implicite et frquence lexicale dun mot dans un texte. Toutefois, les prparatifs de construction de cette exprience nous ont alert sur un point extrmement important pour la suite de cette thse Si les lves du collge des Hautes Ourmes possdent le mme manuel dhistoire gographie, les parties respectives de cet ouvrage ont t traites distinctement lors des inventaires de ltude longitudinale de Lieury. Le manuel dhistoire comporte 154 pages dans lesquelles figurent 9 thmes consacrs principalement lAntiquit. Ces thmes sont rpartis en plusieurs chapitres de tailles ingales. Les analyses statistiques de base sur les 25 pages de lgypte ancienne comptabilisent quelques 7 939 mots rencontrs. Une rduction sommaire de toutes occurrences de formes brutes aux lemmes a t faite. Nous obtenons un total de 1 763 mots diffrents pour ce seul thme du manuel. Sans mme affiner ce chiffre la distinction entre vocabulaire courant (sur la base du Dottrens & Massarenti, 1963) et vocabulaire technique (Lieury, 1991), ce total est intrigant. Une rapide extrapolation du nombre de mots diffrents par thme pour lensemble du manuel estime 10 930 le nombre de mots attendus dans louvrage. Ce chiffre est sans conteste considrablement plus important que les valeurs de 2 716 mots courants + 1 088 mots techniques pour lhistoire en Sixime. Un problme se pose manifestement au niveau du comptage de mots pour notre estimation de louvrage et linventaire de Lieury (1991). Nous avons donc mthodiquement men lenqute pour dterminer sil existait de part et dautre des erreurs, et dans laffirmative, estimer leur ampleur.
140
2. N OUVEL INVENTAIRE DU VOCABULAIRE D HISTOIRE EN S IXIME ( TUDE 1)

Notre premier objectif a t de dterminer le nombre exact de mots courants et de mots techniques dans le manuel dhistoire de 6me sur la base des travaux de Lieury (1991). Or, le seul chapitre sur lgypte ancienne est insuffisant pour estimer ces deux vocabulaires des 154 pages du manuel. Aussi, il a fallu envisager un nouvel inventaire de louvrage en usage au collge. videmment, la solution retenue a t de pratiquer un inventaire assist par ordinateur , la mme manire du thme de lexprience prcdente. Mais avant de donner le dtail des procdures techniques employes, prsentons les tapes ordinaires des traitements informatiques des analyses textuelles.
2.1.
Considrations pratiques des tapes du traitement informatique
Avant toute analyse textuelle, le premier travail du chercheur est la saisie informatique des textes analyser. Que ce soit des textes dauteurs, des contenus dentretiens ou des dictionnaires, de la longueur et de la prcision de cette tape dpendent les impratifs mthodologiques des hypothses des chercheurs. Une fois entrs en machine, les textes sont soumis des analyses du vocabulaire pour effectuer les dnombrements des mots et, selon les considrations thoriques des chercheurs lemmatiseurs versus non-lemmatiseurs , les dnombrements des racines, des couples de mots, des segments rpts du texte, etc. La segmentation des formes graphiques Rappelons quun texte informatis peut tre dfini comme une suite (ou chane) de caractres. Certains de ceux-ci correspondent aux lettres de lalphabet : majuscules, minuscules, lettres diacrises (munies daccent notamment) propres la langue traite ; dautres servent coder les chiffres, la ponctuation, etc. Chacun est reprable par un numro
141
en fonction de la police de caractre retenue (ASCII, ANSI). Avant tout traitement lexicomtrique, le texte analyser doit pralablement tre segment, cest--dire dcompos dune manire systmatique en units minimales. Cette opration est aujourdhui automatise selon des critres de dpouillement formaliss raliss par des programmes informatiques. Pour raliser une segmentation automatique du texte en occurrences de formes graphiques, il faut choisir un sous-ensemble de caractres, les caractres dlimiteurs (ou sparateurs) qui bornent les formes graphiques du texte : on distingue les sparateurs de squence (le blanc, les signes de ponctuations faibles ' " , ; : ) et les sparateurs de phrases (en gnral les ponctuations fortes . ! ? ). Les formes graphiques sont constitues par les caractres non-dlimiteurs. Une occurrence est une suite de caractres non-dlimiteurs borne ses deux extrmits par des caractres dlimiteurs. Deux suites identiques de caractres non-dlimiteurs constituent deux occurrences dune mme forme : lensemble des formes dun texte constitue son vocabulaire [] ; le nombre total des occurrences contenues dans un texte est sa taille ou sa longueur , selon une dfinition de Lebart & Salem (1988). La numrisation des formes graphiques Ltape suivante, la numrisation du texte, consiste en un codage sous forme numrique, par ordre dapparition, des formes graphiques au sein dun dictionnaire. Grce ce dernier, il est ensuite possible de reconstituer le texte selon les besoins des analyses. Analyses du vocabulaire et dictionnaires des formes graphiques Le corpus aprs numrisation est inventori en tables de mots bruts. Le chercheur dcide de poursuivre avec les formes graphiques brutes ou de lancer une lemmatisation du corpus. Selon la sophistication du programme sil intgre ou non des dictionnaires de familles de formes il est possible de rduire aux lemmes les mots bruts et de les dsambiguser pour en construire des lexiques avant toute poursuite des analyses.
142
Quelques analyses textuelles Parmi les analyses classiques des programmes, citons lanalyse en tri crois (croisement du texte avec des modalits telles que des variables chapitre pour un livre ou ge , sexe ou profession dans des interviews) ou lanalyse des units naturelles (les diffrentes parties dun texte : chapitre dun livre, articles dune revue, etc.) qui opre une classification automatique sur ces units. Lanalyse des couples de mots, quant elle, construit une typologie de la squentialit des mots dans le texte. Les classes obtenues sont caractrises par les couples de mots spcifiques et les segments rpts associs.
2.2. Mthodologie employe

2.2.1. Dfinition des entres lexicales
Notre choix dune dfinition des entres lexicales, essentielle pour les prparatifs des textes lanalyse, est fond sur la dfinition utilise par Lieury dans ses recensements (1991). En effet, pour tenter de retrouver linventaire le plus objectif des mots du manuel, notre dfinition ne doit pas sloigner de celle employe au collge. Aussi, nous entendons par entre lexicale toute forme graphique repre dans le texte, lemmatise puis rduite qui admette une signification bien marque. Dune part, cela signifie que pour des mots tels que culture, nous crons deux entres distinctes (les sens de travail de la terre et de connaissances ) et non une seule. Dautre part, il ny pas de famille de mots comme lentendent Nagy & Anderson (1984) : les adjectifs sont considrs comme des entres principales spares. Les locutions ont galement t comptes comme entres (exemples, cause de ou alphabet aramen). Pour enrichir linventaire par rapport la version recense dans ltude longitudinale, nous avons ajout en plus des occurrences un champ nature des mots ainsi que 9 inventaires thmatiques correspondant chacun des thmes de louvrage (la prhistoire,
143
lhistoire, Lgypte, la Palestine, la Grce, Les Romains, la Chine, lInde et les civilisations). Lobjectif est non seulement davoir pour le total du manuel les occurrences des mots mais aussi de prsenter leurs occurrences dans les thmes o elles apparaissent (exemple, Palmyre est prsent 1 fois dans les chapitres sur la Palestine et 5 fois chez les Romains).
2.2.2. Prparatifs au comptage informatis

Comme indiqu ci-dessus, notre premire tape a t de saisir de manire exhaustive les textes analyser. Pour gagner en temps, nous nous sommes aid des techniques informatiques telles que le scanner et la reconnaissance optique de caractres (OCR). Aprs avoir t photocopi, lintgralit du manuel dhistoire a t numris par scanner. Ce matriel brut a ensuite t trait par un logiciel de reconnaissance des caractres pour diminuer au maximum le travail de vrification de la saisie. Aprs vrification des textes (les OCR rcents ont des taux de reconnaissance bien meilleurs), nous avons entam un long travail de formatage des textes saisis selon les rgles du logiciel SPADT (limination des attributs de textes, colonage, dlimitations des units naturelles, etc.). Durant cette tape, nous avons corrig artificiellement les formes graphiques brutes pour quelles correspondent notre dfinition. SPADT autorisant la constitution de dictionnaire distinguant les formes selon leur casse (majuscules / minuscules), nous navons conserv que les majuscules initiales des noms propres. Les mots pleins (substantifs et adjectifs) et les mots fonctionnels (articles, pronoms, prpositions ; Caron, 1989) ont vu, principalement en dbut de phrases, leurs majuscules initiales converties en minuscules. Ce travail sest fait essentiellement manuellement pour une question de fiabilit des changements de casse. Lautomatisation de ce traitement nest pas sans risque si lon veut correctement respecter et distinguer les mots. Au-del des noms propres (Pierre, laptre, est dissocier de pierre, un caillou), des problmes se rencontrent en effet ds la premire lettre de lalphabet. Le a est la forme la plus frquente des
144
conjugaisons du verbe avoir. Sil est crit a ou A , certains logiciels, dont SPADT, compteront ces graphies comme deux formes graphiques distinctes. Par ailleurs, A risque dtre confondu avec la prposition mis en majuscule non accentue comme cest le cas la plupart du temps en dbut de phrase. Cette confusion prend de limportance si le chercheur sintresse aux formes ples du verbe avoir, par exemple. Nous avons galement limin toutes les csures inutiles des mots, les numrotations de pages et les caractres non alphanumriques. Les lettres diacrises des initiales de mots communs ont t converties en minuscules accentues. Les abrviations utiles ont t remplaces par leurs mots non abrgs. La syntaxe des nombres a galement t modifie : par exemple, la valeur 1.000 ou 1 000 est devenue 1000 ; la date 511 ap. J.-C. (mort de Clovis) a t convertie en +511 aprs Jsus-Christ , mme si par la suite les dates et les valeurs napparaissent pas dans les inventaires terminaux. Pour spcifier une locution et viter que le traitement logiciel spare ses constituants nous avons employ le caractre nondlimiteur _ en lieu et place du caractre dlimiteur quest le blanc (Exemple, Ramss II devient Ramss_II). Tous ces correctifs ont t longs. Mme vrifis plusieurs fois, les textes peuvent contenir encore quelques erreurs. Le principe dun comptage exhaustif informatis est techniquement concevable mais suppose que les corpus tudis soient confronts des bases lexicales et grammaticales pralablement construites : dans notre cas, nulle construction pralable nexistait par rapport nos objectifs. Cest pour cela que nous parlons dinventaire assist par ordinateur.
2.2.3. Choix du logiciel de comptage des formes

La construction du matriel de notre exprience sur les rptitions lexicales ayant utilise le logiciel SPADT nous avions entam la mise en forme de la saisie des textes en fonction de cet outil. Cependant, aprs plusieurs mois dutilisation, trois problmes lis au
145
logiciel SPADT ont t reprs. Dune part, les procdures de comptage ont limi n arbitrairement des formes graphiques. Dautre part, loutil sest avr incapable de traiter dun seul bloc les 154 pages du manuel. Enfin, toute locution de plus de 22 caractres sest vu tronque automatiquement. Le premire problme a t mis en vidence en comparant les mots relatifs la Grce aux 1 088 mots techniques de Lieury. Il est apparu que certains mots taient omis dans la table des occurrences des formes graphiques (en particulier le mot Zeus). Le second problme est survenu lorsque nous avons voulu traiter les 154 pages de textes saisies. Ds dpassement de sa capacit de mmoire, le logiciel remplaait les premires entres par les plus rcentes. Pourtant, notre matriel disposait des ressources suffisantes pour ces traitements et les paramtres logiciels du nombre dentres dinitiales de lettres dans le dictionnaire et de rservation de mmoire pour les tables18 taient fixs leurs valeurs maximales. Quant la troncature des mots, elle est intervenue pour des locutions comme Les Manuscrits de la Mer Morte dont il ntait plus possible de dterminer la fin sans connatre ce terme ( Manuscrits_de_la_Mer_M Morte ou Mditerrane ?). Ces problmes sajoutant la difficult des commandes en ligne de linterface, nous nous sommes intress dautres solutions logicielles pour traiter plus facilement et correctement les textes en attente. Parmi les offres du march, le logiciel ALCESTE (Reinert, 1987, 1990) est lun des vtrans de lanalyse textuelle. Mais ce produit ne nous a pas convaincu sur plusieurs points. Si cet outil construit automatiquement le dictionnaire des mots rencontrs en rduisant et lemmatisant les corpus, il ne permet pas de modifier les rgles de lemmatisation et de rduction la diffrence de SPADT. Mais surtout, le logiciel limine sans option les hapax
18
Le logiciel se base sur une estimation de la distribution normale de la frquence des formes graphiques selon leur longueur en caractres. Ds dpassement du quota de mots de plus de n lettres, les premires entres sont crases.
146
et mots de moins de trois occurrences : il est alors impossible dobtenir les formes graphiques rares et sans doute beaucoup de mots techniques seraient limins (exemples dhapax, Akhethotep ou peintures rupestres). Finalement, notre choix sest arrt sur un logiciel ancien dune autre plate-forme matrielle utilise au laboratoire : le logiciel REDACTEUR sous systme TOS (ATARI). Ddi au traitement de texte, il intgre un module lmentaire de statistiques lexicales permettant de raliser la table des occurrences dun texte. Les deux limitations fonctionnelles du logiciel (taille des fichiers et non conservation des majuscules aprs comptage) ont pu tre contournes techniquement. De mme, les textes initialement formats pour SPADT ont t rapidement convertis ce format sans perte dinformations.
2.2.4. Lemmatisation et rduction du vocabulaire

La gnration des tables brutes des occurrences de nos 9 thmes a t obtenue trs rapidement par logiciel. Cependant, le travail sur les tables nest pas encore achev ce stade. Comme nous souhaitons contrler la lemmatisation et la rduction des formes graphiques, cette tche ne peut se faire que manuellement. De plus, notre dfinition autorisant ladmission des homographes comme entres distinctes, nous avons d vrifier dans chacun des neuf thmes le comptage de ces formes polysmiques et crer les entres lexicales ncessaires. Ainsi, 32 524 vrifications, lemmatisations et rductions ont t opres sur les 55 336 occurrences du manuel scolaire ! La totalit du manuel compte en effet 9 667 formes graphiques brutes diffrentes. A ces traitements, sajoutent ceux des 1 513 du thme la prhistoire, les 1 030 de lhistoire, les 2 214 de lgypte, les 1 587 de la Palestine, les 3 621 de la Grce, les 4 291 des Romains, les 1 074 de la Chine, les 1 033 de lInde et enfin les 150 du thme consacr aux civilisations. Compte tenu des problmes logiciels rencontrs et des
147
solutions spcifiques dveloppes, ce premier inventaire du manuel dhistoire en 6me a dur prs de 9 mois !
2.3. Discussion des rsultats

Le tableau ci-dessous rsume rapidement les diffrents totaux de linventaire du manuel dhistoire 6me. Nous y avons insr le nombre dentres lexicales distinctes en fin de traitement, le nombre de formes graphiques brutes au sortir du comptage informatis et le nombre total doccurrences rencontres. Par rapport au tableau prsent par Dro en 1996, ces chiffres sont les derniers correctifs de notre travail : les correctifs portent sur quelques entres lexicales et leurs occurrences (antrieurement, 6 433 entres lexicales pour 55 327 occurrences). Lensemble de linventaire plus quelques champs pour une comparaison avec les inventaires de Dottrens & Massarenti (1963) et Lieury (1991) se trouve dtaill en annexe de ce document (Cf. Annexe 1, page Erreur ! Signet non dfini.). Tableau 11 Rsum de linventaire dtaill du manuel scolaire dhistoire en Sixime de collge et quelques indicateurs sur les entres lexicales Entres lexicales distinctes Prhistoire ..................... Histoire ......................... gypte ........................... Palestine ........................ Grce ............................. Romains ........................ Chine ............................. Inde ............................... Civilisation .................... Total du manuel 1 176 774 1 758 1 187 2 600 3 088 874 846 126 6 433 formes brutes (avant lemmatisation et rduction) 1 513 1 030 2 214 1 587 3 621 4 291 1 074 1 033 150 9 667 Occurrences des entres lexicales 4 196 2 926 7 620 5 264 13 409 16 736 2 600 2 348 237 55 336
N.B. : tous ces totaux incluent des mots outils (articles, pronoms) non soustraits
148
Une vrification de la prsence des mots du vocabulaire courant a t mene dans notre inventaire. Il ressort que le manuel dhistoire ne recouvre que 71 % du vocabulaire de base de Dottrens & Massarenti. Louvrage ninclut en effet que 1 929 mots sur les 2 716. Ce constat est en fait normal car des mots usuels tels que fromage ou vitrine ont peu leur place en histoire. Aussi, pour obtenir le total suppos de mots du recensement de Lieury (1991), nous devons faire la somme des 1 929 mots du Dottrens & Massarenti (vocabulaire courant) et des 1 088 mots du vocabulaire technique. Le total obtenu estime que le manuel dhistoire contient 3 017 mots diffrents. Dans notre inventaire, nous avons retir comme dans les deux tudes du paragraphe prcdent les 46 mots-outils du total. Le dcompte aboutit 6 387 mots distincts. Cela reprsente plus de 3 370 mots supplmentaires aux donnes de Lieury, soit prs de 52,8 % de diffrence. Celle-ci montre que les totaux de ces deux inventaires ( 3 017 vs 6 387) ne sont videmment pas semblables alors quils sont censs fournir le mme dcompte du mme ouvrage. Cette diffrence se retrouve videmment sur le nombre de mots techniques que contiendrait notre inventaire. Sur la base des 1 929 mots courants de Dottrens & Massarenti, nous disposerions de 4 458 mots techniques l o ltude longitudinale de Lieury en a dnombr 1 088. Par ailleurs, nous ne retrouvons que 97 % des mots du recensement de ltude longitudinale dans notre inventaire (1 057 mots retrouvs sur les 1 088). Lexamen attentif des deux travaux rvle que cela tient principalement des diffrences dans les locutions comptabilises par nos soins. Par exemple, Pninsule ibrique qui correspond dans notre tude une entre est dcompose en deux entres (pninsule et ibrique) chez Lieury. Le Tableau 12 prsente un extrait de linventaire en annexe. Il permet de comparer notre recensement celui de Lieury (1991) et de Dottrens & Massarenti (1963) pour quelques mots. Le tableau, tri par ordre alphabtique, commence par les expressions ou titres duvres
149
mises entre guillemets, puis liste les autres entres. Par exemple, le mot argent prsent dans la liste du vocabulaire courant possde ici deux entres lexicales diffrentes. Nous avons distingu le sens de mtal de celui de monnaie . Tableau 12 Extrait du nouvel inventaire du manuel dhistoire de la Sixime, daprs Dro (1996).
Nat.des mots Total manuel Civilisation
1 7
Dottrens & Massarenti
Prhistoire
Inv. Lieury
Palestine
Romains
Histoire
Egypte
Grce
Chine
3 39
Nb 1 2 3 4 5 16 23 24 25 26 29 39 40 432 433 6 6 6 6 6 429 430 431 432 433
Entres lexicales Sens / dtail "Alea jacta est" "De la mort des perscuteurs" "Hellniques" (Xnophon) "Idylles" "la Bible" "Manuscrits de la Mer Morte" 1er Empereur 2e confdration de Dlos 2e guerre mdique 2e guerre punique ,,, ablution abolir argent (mtal) argent (monnaie) Zhou Zhou Confucius Zliten zone Zurich
np np np np np np np np np np prp nc vrb nc nc np np np nc np x x
1 2 1 1 27 1 3 1 1 2 1 039 81
1 2 1 1 1
23
1 1
1 1 2 60 113 102 285 317 35 4 2 1 2 7 2 5 3 1 1 3 1 1 1 1 2 1 1 1 1
4 2 14 7
1 1 1 9 2
55 33 6
19 29 10 57
11 76
17 58
11 87
26 00
30 88
77 4
87 4
84 6
Inde
Total *
Extrait de la lgende prp (prposition) N.B. Une croix x indique que lentre lexicale est prsente dans linventaire en question La colonne sens / dtail prcise le sens dun mot ou fait une remarque concernant lentre lexicale nc (nom commun) np (nom propre / expression) vrb (verbe)
12 6
150
Sur un point plus thorique, le choix du Dottrens et Massarenti comme vocabulaire courant est contestable. Comme nous le discutions au chapitre sur le vocabulaire, ces 2 716 mots correspondent un vocabulaire de base de la langue franaise. Premirement, un vocabulaire basique sous-estime lvidence le lexique des lves. Deuximement, le travail de Dottrens & Massarenti est un vocabulaire mixte tabli partir de productions crites dlves et dadultes provenant de plusieurs autres travaux des annes 1920 aux annes 1940. Il est donc mthodologiquement loign des inventaires des manuels scolaires raliss lors de ltude longitudinale. Troisimement, le travail de Dottrens & Massarenti comporte peut-tre des mots tombs en dsutude ou dont les significations les plus courantes ont chang. Nous retrouvons dans les travaux rcents de Lieury (1996) cette question de la pertinence du dcompte du lexique courant qui est essentielle dans la dfinition de vocabulaire technique. Lauteur considre ainsi quil serait plus judicieux demprunter Ehrlich & coll. (1978) leur estimation faite au primaire comme base du vocabulaire courant au collge. Rappelons que ces trois chercheurs valuent 6 143 mots la connaissance moyenne dun lve en CM2. Toutes ces indications nous ont amen reconsidrer la pertinence de lemploi du Dottrens et Massarenti comme base du vocabulaire courant pour le collge franais. Ne permettant pas de dpartager notre inventaire et celui de Lieury (1991), ce Vocabulaire fondamental du franais devient caduc pour dcompter objectivement les mots techniques de ce manuel et des autres. Ds lors, il nous faut un nouveau vocabulaire courant. Les 6 100 mots connus en CM2 dEhrlich et coll. (1978) tant estims par chantillon, la liste complte ne nous tait pas disponible. Pour ces raisons, il a fallu concevoir un nouvel inventaire des mots du primaire qui respecte la mthodologie employe par notre tude.
151
3. I NVENTAIRE DU VOCABUL AIRE AU PRIM AIRE ( TUDE 2)

Notre deuxime tude porte sur la construction dun lexique du primaire satisfaisant nos prcdentes exigences mthodologiques. Toutefois, lcole primaire nest pas le collge. Nous avons t confront dautres objectifs quant aux programmes en vigueur et au x usages des ouvrages scolaires (livres de lecture ou manuels).
3.1. Choix des ouvrages scolaires

En effet, lcole primaire a des exigences diffrentes du collge. Son organisation des enseignements en tmoigne par un dcoupage moins marqu des disciplines comme cest le cas ds lentre en Sixime. Depuis la loi dorientation du 10 juillet 1989, lcole primaire est organise en trois cycles : le cycle des apprentissages premiers va de la petite la grande section de maternelle ; le cycle des apprentissages fondamentaux couvre la grande section de maternelle jusquau Cours lmentaire 1re anne ; enfin, le cycle des approfondissements va du Cours lmentaire 2me anne au Cours Moyen 2me anne (CM2). Le cycle des apprentissages premiers (cycle 1) privilgie la dcouverte, la varit et le foisonnement des expriences. Ses objectifs sont de scolariser les jeunes enfants et de les socialiser. Il a aussi pour recommandation dapprendre aux jeunes lves communiquer, sinitier lcriture et au monde de lcrit ainsi qu la production orale de texte. Pour le cycle des apprentissages fondamentaux (cycle 2), il est recommand de continuer ces apprentissages premiers de loral vers lcrit. Le cycle des approfondissements (cycle 3) est le lieu de la matrise de la langue et de ses usages tout autant que celui de la lecture et dune certaine autonomisation dans la production de textes crits. Pour le dtail des programmes et
152
le dcoupage des cycles, nous renverrons le lecteur aux ouvrages dits via le Ministre de lducation nationale en 1991 et leur ractualisation en 1995. Les cycles 1 et 2 nous intressent tout particulirement pour le dveloppement qui y est fait des apprentissages de la lecture. Cest gnralement au Cours Prparatoire (CP) que la lecture commence bien sautomatiser chez les lves. Cest pourquoi, nous avons dcid de choisir danalyser des ouvrages scolaires en usage allant du Cours Prparatoire au Cours Moyen 2me anne. Notre collecte compte plus dune vingtaine douvrages diffrents. Ces livres et manuels scolaires proviennent de plusieurs tablissements de lagglomration rennaise19. Les cinq annes que nous avons dtermines ont t redcoupes arbitrairement en trois priodes : le CP, les deux annes du Cours lmentaire et celles du Cours Moyen. En effet, des enseignants nous ont indiqu que certains ouvrages taient parfois utiliss sur deux annes, notamment pour les livres de lecture entre le CE1 et le CE2. Ce dcoupage a t repris dans notre tude n4 sur le dveloppement des connaissances par niveaux chez les lves du primaire (Cf. page 180). Arbitrairement, nous avons convenu de limiter notre choix des livres poursuivant linitiation la lecture au Cours Prparatoire. Pour le Cours lmentaire, nous avons privilgi les livres de textes tout en incorporant un manuel de franais. Au Cours Moyen, nous navons pas choisi de livre de lecture mais opt pour les disciplines telles que lhistoire, le franais, les mathmatiques et linitiation aux disciplines scientifiques. Au final, dix livres provenant de notre collecte ont t retenus : 1 ouvrage sous la forme de trois livrets progressifs pour le Cours Prparatoire ; 5 ouvrages pour le Cours lmentaire 1re et 2me anne ; 4 ouvrages pour le Cours Moyen 1re et 2me anne20.
19 20
Remerciements P. Durand pour sa collaboration auprs des coles rennaises. Ldition des manuels nest pas indique car, comme le fait remarquer Lieury (1991), il ne sagit pas de faire une critique des ouvrages scolaires en soi mais dinventorier les connaissances quils proposent. Toutefois, si ncessaire, ces indications peuvent tre communiques au lecteur.
153
3.2. Traitements des livres et manuels

Compte tenu de lampleur de la tche, nous avions envisag une organisation diffrente de ce travail jusque l personnel. Un groupe dtudiants de psychologie en TER de Licence fut mis sur pied pour nous seconder dans ces traitements. Les comptences individuelles en informatique tant faibles, il fallut organiser une formation aux outils bureautiques et la numrisation de documents, car ces logiciels ne simprovisent pas en quelques conseils. Cependant, malgr la bonne volont des tudiants que nous remercions, ce gain fut modique. Les contraintes temporelles de loption et celles des examens firent que peu de sances de travail eurent lieu. De mme, les consignes de saisie et les conventions que nous avions prises pour le manuel dhistoire 6me furent souvent diversement interprtes. Les diffrences individuelles jouant, certains petits groupes furent plus productifs que dautres. Pour ces raisons, lensemble du travail de saisie a t repris, vrifi et complt par nos soins. Les textes qui ont t soumis au logiciel de comptage sont conformes la dfinition que nous avons adopte pour les entres lexicales et au formatage requis pour le traitement informatique. Les dnombrements termins, les tables doccurrences des dix ouvrages sont nouveau traites sans aide informatique autre que les macrocommandes spcifiquement dveloppes pour linventaire du manuel du collge. Les formes graphiques brutes ont subi une vrification suivie dune lemmatisation et dune rduction pour obtenir nos entres lexicales terminales. Ces dix traitements effectus, les inventaires finaux des manuels ont t regroups selon notre dcoupage en trois inventaires plus importants (CP, CE et CM). Nous avons alors fusionn les tables en liminant les mots doublons et en reportant les sommes de leurs occurrences. Ce travail a t men une dernire fois pour obtenir la table finale de linventaire du primaire.
154
Au total, 90 736 vrifications de formes graphiques ont t faites ! Et sans doute notre inventaire comporte-t-il quelques dizaines derreurs non encore dtectes.
3.3. Examen de linventaire

Le Tableau 13 ci-dessous synthtise notre inventaire des mots courants (scolaires) au primaire. Seuls les totaux du dcoupage CP, CE et CM que nous avons opr y figurent. Le dcompte des dix ouvrages est consultable en annexe (Cf. Annexe 2, page Erreur ! Signet non dfini.). Nous avons galement procd divers calculs complmentaires sur les tables doccurrences de nos dcoupages qui nous ont permis de dterminer leurs recouvrements respectifs. Tableau 13 Rsum des inventaires du Cours Prparatoire, du Cours lmentaire et du Cours Moyen au primaire et quelques indicateurs sur les entres lexicales (Dro, 1996) Entres lexicales distinctes Cours Prparatoire ........... Cours lmentaire 1re et 2me anne .............. Cours Moyen 1re et 2me anne .............. Total du primaire 1 718 5 464 9 095 11 095 formes brutes (avant lemmatisation et rduction) 2 195 9 303 16 274 19 549 Occurrences des entres lexicales 12 741 113 686 163 632 290 059
N.B. : tous ces totaux incluent les mots outils (de, en, ) non soustraits.
Les dix livres confondus, le Tableau 13 indique que 11 095 mots diffrents sont rencontrs au primaire. Le total des mots de notre inventaire est assez proche de lchantillon de ltude dEhrlich et de ses collaborateurs (1978). Rappelons que ces auteurs se fondent sur 13 500 mots slectionns daprs les rponses majoritaires de juges adultes ayant estim le degr de connaissances de ces mots. Tous proviennent par ailleurs du Dictionnaire franais
155
contemporain de Dubois & coll. chez Larousse (1971). Ils respectent des critres de slection assez stricts, en particulier, au niveau de la reprsentation des diffrentes catgories grammaticales du franais. Notre recensement na pas ces exigences. Arithmtiquement, la diffrence entre le CP et le CE est de 3 746 mots, de 7 377 entre le CP et le CM, et de 2 631 entre le CE et le CM. Toutefois, ces valeurs ne sont pas les plus intressantes observer. Celles des mots en communs et leurs pendants, les mots nouveaux, sont plus informatives. Ces analyses complmentaires des tables doccurrences nous ont permis de dresser le tableau suivant : Tableau 14 Nombre de mots en communs et mots supplmentaires entre le Cours Prparatoire, le Cours lmentaire et le Cours Moyen pour un chantillon de 10 ouvrages du primaire CP CE 1 501 mots communs 3 963 mots nouveaux 1 426 mots communs 7 669 mots nouveaux 3 591 mots communs 5 504 mots nouveaux CE
CM
On observe que la progression des mots nouveaux est plus grande entre le Cours lmentaire et le Cours Moyen (5 504 entres) quentre le Cours Prparatoire et le Cours lmentaire (3 963). De plus, rapports linventaire total, les 9 095 des quatre manuels du CM recouvrent 82 % des entres lexicales comptabilises. Notre choix douvrages scolaires disciplinaires au Cours Moyen explique sans doute pour une grande part ce rsultat : comme au collge, ce type de livre est propice fournir beaucoup de mots nouveaux. Dautre part, les mises en page des ouvrages sont diffrentes. Au CP, les ouvrages sont peu volumineux et les textes sont crits en gros caractres. La densit des mots saccrot au fur et mesure des annes ainsi que le nombre de pages.
156
Dune manire gnrale, laccroissement des mots disponibles dans les livres scolaires est considrable sur les cinq annes tudies. Le Tableau 14 fournit un autre renseignement utile. Parmi les 1 718 mots du CP, 1 501 dentre eux sont prsents dans les cinq ouvrages du CE et 1 426 dans les quatre manuels du CM. Nous avons examin par le dtail les mots non inclus dans les deux autres inventaires (la diffrence aux 1 718 entres du CP). On apprend que les noms propres des personnages des livres ainsi que les nologismes de circonstances sont absents des autres recensements, ce qui tait prvisible. Nous avons alors essay de dterminer combien de mots du CP taient prsents dans tous les autres ouvrages. Le rsultat obtenu nous a assez surpris. Il est en effet tonnant de constater que seuls 213 mots du CP se retrouvent dans les dix ouvrages. Leur liste, qui ne saurait tre notre vocabulaire courant scolaire, est propose en Annexe 3, page Erreur ! Signet non dfini.. Elle comporte bien videmment les mots outils mais aussi des mots trs usuels comme construire, enfant ou voiture que lon retrouve aussi dans le vocabulaire de base du Dottrens & Massarenti (1963). Au total, ces 213 mots ne correspondent peine qu 2 % de notre inventaire. Nous avons voulu vrifier si le Vocabulaire fondamental du franais tait totalement retrouv parmi les 11 095 mots de notre base. Les tris rvlent que 95 % du vocabulaire basique de Dottrens & Massarenti sont inclus dans notre tude : 2 583 entres sur les 2 716. La construction de notre chantillon partir des manuels scolaires est donc satisfaisante pour ltude du vocabulaire courant chez les lves du primaire. Ces rsultats nous indiquent que la croissance des mots nouveaux dans les ouvrages scolaires du primaire est trs rapide. Mais, les travaux de Lieury montrent que quantitativement la progression des mots techniques est plus importante encore au collge (Lieury & coll., 1992b). Le dcoupage des disciplines semble favoriser cette explosion de mots nouveaux dans les ouvrages scolaires.
157
3.4. Vocabulaire technique en histoire 6 m e

Sur cette nouvelle base du vocabulaire courant au sortir du CM2, nous allons pouvoir dterminer le nombre de mots techniques contenus dans notre dpouillement du manuel dhistoire en Sixime. Mais auparavant, observons le recouvrement du dcompte de Lieury (1991) dans notre inventaire des coles. De la mme manire quavec les mots du Vocabulaire fondamental du franais et les autres inventaires du CP au CM, nous avons extrait les mots en commun entre notre recensement et celui des mots techniques dhistoire de Lieury. Sur les 1 057 mots, 19 sont dj prsents avant la classe de Sixime, soit 1,8 % des mots. Si nous les dcomptions du total pour le manuel, la rvaluation fixerait 1 038 le nombre de mots techniques selon notre base du vocabulaire courant. Le fait que notre inventaire emploie au CM un ouvrage relatif lhistoire rendait probable lapparition dune partie de ce vocabulaire technique avant la Sixime. Toutefois, ces 1 038 mots rapports aux 6 433 du total font que 16,1 % seulement du livre ont t dnombrs comme mots techniques : pour les collaborateurs de ce dpouillement, 83,9 % de ce total seraient considrs comme des mots du vocabulaire courant. Nos recensements du primaire et du manuel dhistoire en 6me tant
mthodologiquement comparables, nous les avons rapprochs. Le nombre de mots courants lintrieur de louvrage sur lhistoire se monte 3 742 mots (58 % du manuel). Par diffrence, ce livre inclut 2 691 mots techniques. Ce total dpasse de loin linventaire manuel men par les collaborateurs tudiants de Lieury : il est 2,6 fois plus grand que celui-ci. Notre enqute a pour linstant abouti retrouver le vritable dcompte du vocabulaire du manuel en question. Au-del des mthodes (confrontation visuelle une liste versus extraction informatique des doublons), il nous faut maintenant dcouvrir lorigine de la sousestimation du travail ralis lors de ltude longitudinale. Lexplication qui est recherche
158
permettra de rpondre cette interrogation : est-il possible rapidement, sans reprendre la totalit de ltude longitudinale, de rvaluer les inventaires des manuels scolaires du collge ?
159
4. D IFFICULT DU VOCABUL AIRE D HISTOIRE EN 6 M E ( TUDE 3)

Dans cette tude nous avons donc tent de retrouver pourquoi et comment les tudiants lors de ltude longitudinale ont sous-estim les mots techniques (1 038 mots au lieu de 2 691 mots sur la base de notre inventaire du primaire). Nous avons mis alors plusieurs hypothses exploratoires sur les conditions du recensement des manuels scolaires et du travail effectu.
4.1. Hypothses sur les erreurs du recensement manuel

A les regarder de plus prs, ces travaux de recensement des mots (mme ceux assists par ordinateur) sont trs longs et monotones ! Ils demandent en effet des efforts attentionnels durables et rpts vis--vis de la tche. Dans linventaire manuel des quatre annes du collge, la tche des tudiants tait plus contraignante que celle donne aux tudiants du TER (ressaisie des textes). Pour chaque page des livres scolaires, il fallait vrifier tous les mots prsents par rapport ceux de la liste du Vocabulaire fondamental du franais de Dottrens & Massarenti. Les mots absents de cette liste taient nots comme mots nouveaux sous un tableur. Dans ce long travail, les risques domission sont en effet plus grands. La relecture dun texte limine plus facilement lomission de mots alors que ce travail ncessite dtre totalement revrifi par ltudiant ou par un tiers. Une premire hypothse aurait t que la dure des vrifications et leurs ritrations jouaient un rle non ngligeable sur le nombre derreurs commises par les collaborateurs de ltude longitudinale durant le recensement du vocabulaire. Mais, la dmonstration
160
exprimentale de cela aurait t difficilement ralisable et peu utile si on souhaite corriger par estimation les inventaires du collge. Par ailleurs, reprer des mots nouveaux ou ressaisir et coder des textes ne sont pas des activits particulirement gratifiantes dans la recherche. Aussi, le facteur motivation est-il sans doute impliqu dans la ralisation de ces travaux. Quelques observations sur notre groupe du TER de licence (prparatifs au recensement du vocabulaire) ont confirm limportance de cette variable lors de la saisie des textes du primaire et leur mise en forme. Limplication de certains tudiants dans ce travail a t remarquable sur quelques indicateurs tels que le nombre de pages traites ou la qualit du codage des textes la fin de lop tion. Certes, nos propos se fondent sur des indications non exprimentes dune part, et a posteriori dautre part. Mais elles se rapprochent dautres indicateurs exprimentaux utiliss dans les recherches sur la motivation (Cf. Fenouillet, 1996 ; Lieury et Fenouillet, 1996). Cette rflexion nous a permis denvisager une autre explication de lampleur des diffrences entre notre dcompte et celui de Lieury (1991). Nous avons pens que les collaborateurs de ltude du collge ont pu interprt la consigne de vrification des mots. La tche devenant rapidement monotone, ils auraient adapt leur travail. Plutt que de vrifier systmatiquement tous les mots, ils nauraient plus regard quoccasionnellement la liste de Dottrens & Massarenti. Pour gagner en temps, ils auraient subjectivement valu la technicit des mots du texte avant de confronter les plus techniques la liste du vocabulaire courant. Cette hypothse nous a paru plus facile vrifier que la premire. Aussi, avons-nous ralis une pr-exprience pour dfinir cette ide de technicit des mots.
161
4.2. Pr-exprience (mots courants / mots techniques)

Nous ne voulions ni ne pouvions recrer artificiellement les conditions du recensement manuel dont nous possdions dj les aboutissements. Nous souhaitions, dune part, construire une premire exprience pour dterminer sur quelle dfinition de technicit les tudiants avaient pu recenser les mots. Dautre part, il nous fallait faire en sorte que les sujets de notre tude traitent tous les mots dune liste, sans en omettre un seul. Pour cela, nous avons opt pour une exprimentation informatise o ltudiant ne pouvait ngliger quelque rponse que ce soit. Cest pourquoi, les conditions de passation sont assez distantes de celles de ltude longitudinale o des textes taient vrifis et non des mots isols. Les sujets nont pas les textes dans lesquels litem est apparu : ils ne bnficient donc pas du contexte du mot. Cela aurait t difficilement ralisable en temps et en solution technique mettre au point. Nous avons suppos que les collaborateurs de Lieury avaient valu les mots des textes sur une dichotomie mots courants / mots techniques conforme lobjectif du travail qui leur tait donn. Nous nous attendions observer une rpartition de cette taxonomie subjective proche des 16,1 % de mots techniques et 83,9% de mots courants de ltude longitudinale par rapport nos 6 433 mots totaux. La pr-exprience qui a t construite a port sur un chantillon de 321 mots parmi les 6 433 de notre inventaire actualis (soit 1/20me des mots du manuel). Nous avons demand 15 sujets adultes (tudiants en Psychologie 1re anne) de dcider si les items leur paraissaient tre soit un mot considr comme appartenant un vocabulaire courant pour un enfant de Sixime, soit comme un mot dun vocabulaire technique propre la discipline de lhistoire en classe de Sixime. Les items apparaissaient un un sur un cran informatique. Le temps de dcision tait libre, les items senchanant ds la rponse du sujet. Ces derniers ont t familiariss la passation informatise sur quelques autres items de nos 6 433 mots du manuel scolaire. Les rponses taient enregistres laide des boutons dune souris que les
162
sujets tenaient en main (la correspondance des boutons de rponses la distinction des mots tait contrebalance). Les rsultats sommaires de cette pr-exprience font apparatre que 40 % des mots de cet chantillon de 321 mots sont valus comme tant des mots techniques de lhistoire. Lestimation, reporte sur les 6 433 mots, nous donnerait un total de 2 573 mots techniques. Ce chiffre parat proche des 2 691 mots techniques dduits de la base du primaire, toutefois un effectu entre mots techniques et mots courants pour cette estimation et notre inventaire ( = 4,48 ; ddl = 1 ; p < . 05) montre que ce nest pas le cas. Cette valuation ne se rapproche pas non plus des valeurs calcules pour le lexique de Lieury & coll. ( = 452,88 ; ddl = 1 ; p < . 0001). Ainsi, la consigne de distinguer subjectivement les mots techniques des mots courants ne donne pas les rsultats attendus. La technicit des mots ne semble pas sapprcier sur la seule distinction dichotomisante courant versus technique. Une piste supplmentaire va nous tre fournie par les commentaires des 15 sujets. Ceuxci nous ont fait la remarque, premirement, que la difficult des items tait ingale : certains taient trs simples, dautres trs difficiles. Aussi, pour ces items leurs dcisions se trouvaient facilites par rapport des mots qui auraient rclam une chelle polychotomique. Deuximement, les sujets ont indiqu que la dsignation de mots techniques tait floue, certains mots mmes difficiles ne leur paraissant pas strictement des mots techniques. Ces indications des sujets et labsence de rsultats probants dans ce premier travail, nous ont amen reconsidrer lutilisation de la distinction mots courants / mots techniques dans une telle exprience. Nous avons pour cela choisi de considrer la technicit du vocabulaire du manuel dhistoire sous langle de la difficult des mots. Une autre exprimentation a alors t conue.
163
4.3. Exprience (degrs de difficult du vocabulaire)

Dans son tude de 1991, Lieury a dj utilis, mais dans un autre but, la difficult des mots du vocabulaire. Dans son exprience, une estimation de la difficult des mots techniques a t ralise auprs dexperts et de candides. Ltude a port sur les jugements de professeurs de collge spcialistes de la matire appels experts et par des professeurs candides dune autre discipline. Ces enseignants qualifiaient la difficult des mots techniques de toutes les disciplines de 6me (dont ceux dhistoire) qui taient consigns dans un livret de passation. Les critres donns aux notateurs taient les suivants : 1. trs facile ; mot dusage courant 2. facile ; mot devant faire partie des connaissances de la 6me 3. moyen ; mot devant pouvoir tre acquis en 6me 4. difficile ; mot pouvant tre rserv une anne ultrieure 5. trop difficile ; mot devant absolument tre report une anne ultrieure Une cinquantaine de professeurs de collge de la rgion rennaise ont particip ltude. Lieury constate que la subjectivit apparat nettement travers la diversit des jugements. En fonction des disciplines, la difficult des mots est tantt sous-estime chez les experts et tantt chez les candides (cas du franais). Lauteur esprait que les experts sous-estimeraient toujours la difficult des mots. Or ce nest pas le cas gnral sauf en biologie. Nous nous sommes donc inspir de cette tude et de son chelle de difficult en cinq points pour raliser notre exprience, non plus auprs denseignants mais auprs dtudiants candides. Nous avons dterminer un gradient de difficult : (1) mots trs faciles ; (2) mots faciles ; (3) mots de difficult moyenne ; (4) mots difficiles ; (5) mots trs difficiles. Par contre, plutt de le faire auprs dun chantillon de mots (321 dans la pr -exprience), nous
164
avons dcid dinterroger lensemble des 6 433 mots de notre inventaire de faon complter celui-ci par une note de difficult associe chaque mot.
4.3.1. Hypothses
Plusieurs hypothses ont t formules. Premirement, nous nous attendons ce que les mots techniques soient gnralement plus difficiles que les mots courants. Deuximement, nous pensons que les collaborateurs de Lieury (1991) se sont appuys sur la difficult subjective des mots dans les textes du manuel dhistoire. Ils auraient majoritairement extrait les mots techniques partir des mots jugs les plus difficiles pour ensuite les vrifier la liste des mots courants de Dottrens & Massarenti. Nous pouvons donc attendre que la rpartition de la difficult des mots techniques de notre inventaire et du prcdent ne soit pas proportionnellement la mme.
4.3.2. Matriel
Afin que lvaluation demeure dans le domaine du raisonnable et du ralisable par les sujets, la base des 6 433 mots a t segmente en plusieurs blocs. Au total 18 blocs de mots ont t constitus. Un sujet a donc en moyenne valu quelques 357 mots. Souhaitant avoir une valuation portant sur un minimum de 8 jugements par mot, cest au total 144 sujets qui ont particip lexprience. Pour chacun des items lcran, les sujets devaient valuer la difficult de ce mot pour un enfant de 6me pour la discipline de lhistoire. Ces sujets, a contrario des expriences de Lieury (1991) ne sont pas des experts du domaine. Il eut en effet t relativement difficile de rassembler 144 enseignants dhistoire pour ces valuations. Cette exprience souffre, rptons-le, de la mme limitation en ce qui concerne la proximit aux conditions de ltude longitudinale pour la vrification des mots dans des textes. Aussi, de faon diminuer le problme du sens en contexte, chaque fois quun terme tait polysmique une note informative, sous la forme dun mot ou dune petite locution entre
165
parenthses, tait prsente sur la mme ligne dapparition que litem : elle indiquait brivement le sens appropri du mot valuer. Cette indication apparaissait dans la seconde page de la consigne destine aux sujets, avant quils ne commencent la phase de familiarisation portant sur quelques mots. Pareillement, les titres duvres et les expressions taient mises en relief au moyen de guillemets. Ces considrations taient indiques aux sujets via la consigne donne avant le dbut de lexprience, la fois par lexprimentateur et par lcran de consigne. Variables dpendantes Nous avons pour chacun des items collect deux variables dpendantes. La premire est la note de difficult de litem dont nous avons pris le mode. La seconde variable dpendante est le temps de rponse par item, exprim en millisecondes21 pour vrifier de manire complmentaire sil existe une incidence du degr de difficult sur le temps de rponse. Monotonie de la tche De manire limiter la monotonie et la moindre attention vis--vis de la tche, deux pauses taient introduites chaque tiers de la passation : un bloc de 357 mots tait administr en trois temps (ou sous-blocs) ; le sujet dcidait de la dure des pauses entre les sous-blocs. Contrebalancement des items / effets dordre A lintrieur de chaque sous-bloc ditems un contrebalancement a t effectu en fonction du numro du sujet. Cependant, pour viter que lordre des items dun bloc ne soit le mme pour tous les sujets valuant celui-ci, le numro du sujet tait attribu de manire alatoire et non incrmentielle par rapport la liste de passation (il fallait viter davoir des
21
Compte tenu du dispositif de rponses choisi, un clavier PC de type AT et de lhorloge interne des micro ordinateurs de type PC, limprcision du temps de rponse est de lordre de 50 millisecondes.
166
sujets 1, 19, 37, etc... pour le bloc n1 car ils auraient eu le mme ordre dapparition des items). Passation La prsentation des items se faisait sur un moniteur de micro-ordinateur PC. Les items de couleur noir sur fond blanc apparaissaient au centre de lcran. La fonte retenue tait une police sans empattement de caractre gras dune taille denviron 36 points. La casse de litem changeait en fonction de la nature des mots : seuls les noms propres et les titres duvre comportaient une majuscule initiale. Dispositif de collecte des rponses Le clavier habituel dun PC a t utilis pour collecter les rponses des sujets. De faon limiter les erreurs de saisie dans les rponses, toutes les touches du clavier ont t enleves. Seules cinq touches, espaces, ont t repositionnes sur le clavier (touches portant les labels F1, F2, F3, F4 et F5) pour servir de touches rponses. Aussi, pendant la dure de la passation, seules les touches de rponses sont demeures actives : toute autre touche ne permettait pas de collecter la rponse et de passer litem suivant. De mme, un appui prolong (suprieur 1 seconde) sur la touche de rponse ne permettait pas de passer litem suivant. Litem restait lcran tant que le sujet ne lavait pas valu. Sous les touches, des tiquettes rappelaient la correspondance des touches notre chelle de difficult. Sitt la rponse donne, lcran seffaait durant 500 millisecondes avant dafficher litem suivant. En annexe, les consignes et crans de passation ont t dtaills (Cf. Annexe 4-2, page Erreur ! Signet non dfini.).
167
4.3.3. Analyses des rsultats

Avant tout traitement statistique, une remarque est faire sur le nombre ditems traits. Des erreurs survenues lors des prparatifs de lexprience ont t repres aprs la passation de celle-ci. Quatre mots sont concerns : deux ont t omis, les deux autres comportant des erreurs smantiques dans leur prsentation lcran. Les mots manquants sont et motif (ayant pour signification but ). Les mots errons de par leur sens sont mal et Loth (neveu dAbraham alors que lorthographe utilise a t Lot ) notre exprience totale a donc trait 6 429 items. Nous renvoyons le lecteur lannexe 1 (page Erreur ! Signet non dfini.) qui contient galement lintgralit des notes modales de difficults des mots tudis sur lesquelles nous allons statuer. Un dajustement montre que la rpartition de la difficult des mots nest pas gale sur le total des mots de notre inventaire ( = 192,06 ; ddl = 4 ; p < .00001). Une analyse de la variance porte sur les temps de rponse moyens des sujets rvle que ces temps sont significativement diffrents selon le degr de difficult enregistr (F [4 ; 6 424] = 206,1 ; p < .0001). Les items de niveaux trs facile et trs difficile sont plus rapidement valus que les autres. Le niveau difficult moyenne requiert plus de temps que les autres (moy. = 2 825 ; cart-type = 1 035). On observe ainsi que le temps de dcision augmente du niveau 1 de difficult (moyenne de 1 976 ms, cart-type de 860 ms) jusquau niveau 3 de difficult puis se rduit nouveau. Les modalits extrmes sont ainsi traites plus rapidement que les niveaux intermdiaires.
168
Figure 15
Temps de rponse moyen selon la difficult subjective des mots
Temps de rponse (ms)
4000 3500 3000 2500 2000 1500 1000 trs facile facile difficult moyenne difficile trs difficle 1976 2549 2825 2661 2158
Aprs avoir vu de manire gnrale quil existait des diffrences entre les modalits de notre chelle de difficult, nous avons voulu observer comment les mots courants et les mots techniques se rpartissaient sur cette chelle. Un U de Mann-Whitney (Cf. annexe 4-2 c, page Erreur ! Signet non dfini.) comparant le vocabulaire courant au vocabulaire technique en prenant comme valeurs ordinales le degr de difficult des mots a t effectu avec nos 6 429 items utiliss. Ce test indique que le vocabulaire technique est significativement plus difficile que le vocabulaire courant (z = -52,43 ; p < .00001). Les Tableau 15 et Figure 16 ci-aprs montrent que la distribution des mots techniques offre une symtrie inverse de celle des mots courants quand on examine leur difficult. Tableau 15 valuation de la difficult subjective des mots du manuel dhistoire 6me selon la distinction vocabulaire courant / vocabulaire technique de notre inventaire Difficult subjective des mots 1 trs facile Mots courants Mots techniques Total 1 554 105 1 659 2 facile 1 081 238 1 319 3 difficult moyenne 752 491 1 243 4 difficile 262 703 965 5 trs difficile 89 1 154 1 243 Total 3 738 2 691 6 429
169
Figure 16
Reprsentation graphique des distributions des mots courants et des mots techniques selon lchelle subjective de difficult
2000 1600 1200 800 400 0 Mots courants Mots techniques Total inventaire Dro
trs facile facile difficult moyenne difficile trs difficile
Pour dterminer si notre chelle de difficult pouvait tre relie la distinction vocabulaire courant / vocabulaire technique, nous avons utilis le qui est un indicateur de
distance entre les variables (Guguen, 1997). Ce coefficient, insensible aux effectifs, se fonde sur le qui lui dpend du nombre dobservations. Ici, nous obtenons une liaison de .67 entre difficult du vocabulaire et le dcoupage mots courants / mots techniques qui montre que les deux variables sont bien lies entre elles. Par ailleurs, les temps de rponses pour les mots techniques demeurent significativement diffrents selon la difficult subjective value (F [4 ; 2 686] = 67,13 ; p < .0001). La courbe de ces valeurs a la mme allure que celle de la Figure 15 sur lensemble des 6 429 items de lexprience.
Notre recalcul du nombre de mots techniques chez Lieury doit maintenant tre compar notre vocabulaire technique sur cette mme chelle de difficult. Les Figure 17 et Tableau 16 suivants comparent la rpartition de la difficult des mots techniques de Lieury & coll. par rapport aux ntres.
170
Tableau 16 Comparaison de la difficult subjective des mots techniques du manuel dhistoire 6me selon les deux inventaires Difficult subjective des mots techniques 2 3 4 5 facile difficult difficile trs difficile moyenne 45 111 266 595 238 491 703 1 154
1 trs facile Inventaire Lieury Inventaire Dro 21 105
Total 1 038 2 691
Figure 17
Reprsentation graphique des distributions des mots techniques chez Lieury & coll. et Dro selon lchelle subjective de difficult
1600 1200 800 400 0 Inventaire Lieury & coll Inventaire Dro
trs facile facile difficult moyenne difficile trs difficile
Nous observons galement que sur la Figure 17 cette chelle de difficult est intressante dexamen chez les mots techniques de Lieury & coll., car les rpartitions entre nos mots techniques et les leurs semblent proportionnellement quivalentes. Nous allons maintenant tenter de le vrifier. Un dindpendance comparant ces deux inventaires techniques montre que ceux -ci nont pas les mme rpartitions concernant la difficult des mots ( = 87,07 ; ddl = 4 ; p < .00001). Nous avons converti en pourcentages les diffrents inventaires de mots
171
techniques afin dapprcier les diffrentes proportions de difficult des mots dans ces deux travaux. Figure 18 Comparaison en pourcentages des mots techniques chez Lieury & coll. et Dro selon lchelle subjective de difficult
80 70 60 50 40 30 20 10 0
57,32 42,88 25,62 26,12 18,24 2,02 3,9 trs facile 8,84 4,33 10,69
% age
Inventaire Lieury & coll Inventaire Dro
facile
difficult moyenne
difficile
trs difficile
Demble, nous remarquons que les tudiants de Lieury ont extrait les mots techniques du manuel parmi les mots plus difficiles (57,32 %) alors que ces mots ne reprsentent que 42,88 % dans notre lexique technique. Si les mots difficiles sont de proportions quivalentes, les mots moins difficiles sont linverse beaucoup plus nombreux dans notre inventaire. Cest pourquoi nous avons opr des regroupements sur les niveaux de difficult. Nous avons arbitrairement considr des mots de difficult faible ou modre (somme des niveaux trs facile, facile et de difficult moyenne) par rapport des mots de grande difficult (mots difficiles et trs difficiles).
172
Figure 19
Comparaison en pourcentages des regroupements de la difficult des mots techniques des inventaires de Lieury & coll. et Dro
100
82,94
80
69
% age
60 40 20 0
difficult faible ou modre grande difficult 17,6 31
Inventaire Lieury & coll Inventaire Dro
Les mots de grande difficult reprsentent chez Lieury & coll. 82,94 % (861 / 1 038) des mots techniques alors que notre inventaire technique nen compte que 69 % (1 857 / 2 691). Un croisant les valeurs avec les deux inventaires montre lindpendance des deux travaux ( = 73,66 ; ddl = 1 ; p < .00001). Vraisemblablement les collaborateurs de Lieury ont slectionn les mots techniques parmi les mots de grande difficult. Leur dfinition de la technicit des mots recoupe sans doute cette distinction entre mots de difficult faible ou modre et de grande difficult.
4.3.4. Conclusion
La distinction vocabulaire technique / vocabulaire courant utilise chez Lieury (1991) pour parler des connaissances encyclopdiques scolaires par rapport aux mots usuels comporte un biais. Celui-ci provient de la manire dont ses collaborateurs techniques ont procd aux recensements du vocabulaire. Leur sous-estimation du lexique technique serait principalement due une valuation subjective de la technicit des mots des thmes de louvrage. Plutt que de vrifier systmatiquement la prsence ou labsence dun mot par rapport au vocabulaire courant de rfrence, les tudiants ont essentiellement slectionn les mots de grande difficult comme mots techniques de louvrage dhistoire.
173
Nous avons vu que si ces termes spcifiques sont valus comme plus difficiles que ceux du vocabulaire courant, les deux types de lexique se rpartissent loppos lun de lautre sur le gradient de difficult subjective de nos items. Lexamen des temps de rponses nous a fait observer que ceux-ci ont lallure dune courbe en cloche o les items des niveaux de difficult extrmes trs facile et trs difficile sont plus rapidement valus que ceux des niveaux intermdiaires. Ce rsultat se retrouve chez les mots techniques et chez les mots courants. Toutefois, rappelons que notre inventaire du primaire ne se fonde que sur 10 ouvrages. Bien videmment, la quantit de manuels a une incidence sur le nombre de mots techniques que nous recensons dans le manuel dhistoire 6me. Si nous avions effectu un inventaire de mots courants plus important, nous aurions sans aucun doute constat que la difficult de nos mots techniques (moins nombreux par ailleurs) tendrait augmenter. Il serait possible de continuer ces analyses en sattachant la nature des mots, notamment les noms propres que le prcdent vocabulaire courant basique de Dottrens & Massarenti nincluait pas.
174
5. R VALU ATION DES INVE NTAIRES DU COLLGE

Lampleur des diffrences releves entre nos lexique du manuel dhistoire 6me et celui ralis par les collaborateurs techniques de Lieury a ncessit que nous menions une vaste enqute mthodologique. Cette enqute sachve maintenant. Elle nous a permis dexaminer en profondeur non seulement linventaire du manuel dhistoire 6me incrimin mais aussi la base du vocabulaire courant admise lors de ltude longitudinale du collge franais (Lieury, 1991-1996). Si cette tude admettait le Vocabulaire fondamental du franais de Dottrens & Massarenti comme lexique courant en 6me et dans les autres annes du collge, nous avons pu montrer que ce choix tait contestable. Ainsi, avons nous d crer un inventaire du vocabulaire scolaire du primaire franais compatible avec la dfinition dentres lexicales retenue par lquipe de Lieury. Bien que cet inventaire chantillonne trs peu de manuels par rapport ltude de Nagy & Anderson (1984), il comporte plus de 11 000 mots que nous avons appels mots courants. La confrontation du manuel dhistoire ces mots a pu montrer que 58 % dentre eux avaient dj t utiliss dans les livres du primaire. Mais, le total de mots techniques supplmentaires ltude de Lieury demeure trs important : le travail prcdent sous-estime de prs de 2,6 fois le nombre de mots techniques dans cet ouvrage. Ce chiffre provient semble-t-il dune valuation subjective de la difficult des mots du manuel qui a t prfre la consigne de comparaisons systmatiques des termes rencontrs du vocabulaire courant de rfrence. Nous pouvons, daprs les quelques tudes qui viennent dtre menes, tenter une estimation corrige du nombre de mots nouveaux spcifiques des disciplines scolaires du collge. Le Tableau 10 ci-aprs se fonde sur lcart relatif entre notre vocabulaire technique en histoire 6me et le nombre de mots techniques de ltude prcdente que nous avons retrouv (compte tenu de quelques diffrences dans le choix dentres lexicales). Nous avons
175
donc diminu les inventaires de Lieury (1996) de 4,6 % de mots avant de les remultiplier par 2,59 ce qui donne un coefficient de correction de 2,473. Tableau 17 Restimation du vocabulaire technique du collge franais sur la base du vocabulaire dhistoire 6me (rpartitions par matire) Matires scolaires Franais .................................... Histoire ..................................... ducation civique ..................... Gographie ............................... Anglais ..................................... Biologie (Gologie en 4me) ..... Physique Chimie ................... Mathmatiques ......................... Total des manuels 6me 4 919 2 691 2 008 2 038 1 770 994 641 413 15 622 5me 6 657 7 026 1 041 3 388 2 879 1 919 524 502 23 936 4me 13 302 8 054 4 071 6 519 5 821 2 718 2 797 1 412 44 695 3me 17 432 16 624 7 218 5 619 6 074 5 275 1 088 59 325
Faute davoir ce jour repris linventaire de tous les manuels scolaires du collge, nous ne pouvons quobserver que les estimations obtenues sont considrables : dun objectif de 15 600 mots nouveaux techniques en fin 6me nous passons plus de 59 300 termes techniques en 3me. Sans doute, le coefficient que nous avons utilis nest pas appropri pour toutes les matires. Notre estimation est peut-tre trop importante pour le franais qui incorpore vraisemblablement dj beaucoup de mots du primaire. Cest en histoire que lon peut raisonnablement penser que les estimations seraient les plus fiables. Au final, ce travail remet certes en cause les inventaires de ltude longitudinale mais ne conteste pas la validit des conclusions de Lieury et de ses collaborateurs sur limportance de la mmoire dans la russite scolaire. Nous critiquons une mthode manuelle de recensement des mots en proposant une autre mthodologie plus objective, mais nanmoins critiquable elle aussi, quest le dcompte informatis des mots.
176
Disposant dsormais dun inventaire des mots avant la Sixime, il nous tait possible dvaluer le dveloppement des connaissances lexicales de ces mots chez les enfants dcole primaire. Le chapitre 4 est consacr deux approches tudiant ce thme.
177
Chapitre 4 DVELOPPEMENT DES CONNAISSANCES AU PRIMAIRE
Dveloppement des connaissances au primaire
178
Le plus simple colier sait maintenant des vrits pour lesquelles Archimde et sacrifi sa vie. Ernest Renan, Souvenirs d'enfance et de jeunesse.
1. I NTRODUCTION
Pour le collge, nous disposons dune estimation du vocabulaire prsent dans les ouvrages ainsi que de tous les rsultats relatifs au lien entre mmoire encyclopdique scolaire et russite scolaire (Lieury, 1991, 1996 ; Lieury & coll. 1992a, 1992b, 1995a, 1995b). La ralisation de notre inventaire du primaire (tude n2) pris comme nouvelle base du vocabulaire courant pour le collge na pas encore t utilise pour une valuation des connaissances. Aussi, dans ce chapitre, nous avons voulu vrifier le dveloppement du vocabulaire au primaire en utilisant comme au collge les manuels en usage. Les inventaires des mots du CP au CM2 tant raliss, nous sommes parti de ces bases pour valuer le dveloppement des connaissances des lves sur ces entres lexicales. Les expriences que nous avons menes viennent complter celles du collge en interrogeant avant lentre en Sixime le vocabulaire courant. Si Lieury parle de mmoire encyclopdique pour les lexiques techniques de la Sixime la Troisime, nous ne pouvons strictement reprendre ce terme au primaire. Aussi, parlerons-nous dune manire gnrale de connaissances scolaires du primaire.
179
Ltude longitudinale au collge a privilgi jusquici les questionnaires choix multiples dont on sait quils sont plus aiss que les autres types dpreuves interrogeant les connaissances (Flieller & coll., 1992). Cette technique dvaluation a examin anne aprs anne la connaissance des mots techniques des matires enseignes. Le recoupement des mots, hormis pour la 6me et la 5me (Lieury, 1991), na pu tre fait sur lensemble des annes suivies. Aussi, les courbes qui rsument ce travail ne font pas apparatre, par exemple, de dveloppement du vocabulaire courant. Pourtant, il est certain que dune anne sur lautre des mots techniques de faible difficult (Cf. chapitre 3, tude n3) et dj rencontrs en Sixime vont passer dans le vocabulaire courant des lves. De plus, sachant quun enfant napprend pas le vocabulaire courant uniquement lcole, il vient celle-ci avec un capital de mots quil va y dvelopper. Cest pourquoi, au primaire, nous avons souhait savoir combien dannes taient ncessaires pour quun lve connaisse le sens dun mot que lon sait apparatre durant sa scolarit (sil ne le possde dj). Nous avons construit deux tudes transversales qui utilisent la mthode des questionnaires choix multiples (QCM). La premire cherche connatre le nombre de mots acquis en une anne par un lve. Les expriences menes dans les diffrentes classes rejoignent ce qui a t fait classiquement au collge. Ces donnes permettront de rapprocher nos rsultats de ceux du collge. La seconde tude porte sur le suivi de lacquisition dun chantillon de mots tout au long du primaire (du CP au CM2) avec en plus lanne de la 6me. Nous avons voulu suivre la trace le dveloppement des connaissances scolaires en vocabulaire en supposant que les lves avaient dj des savoirs pralables.
180
2. E STIM ATION DES CONNAI SSANCES SCOLAIRES PAR QCM DE NIVEAU ( TUDE N 4)
Cette premire srie dexpriences est calque sur les questionnaires administrs au collge. Pour vrifier que les manuels scolaires sont une rfrence fiable dans notre tude, nous avons contact deux tablissements scolaires diffrents : tous deux utilisent quelques uns de ces manuels dont nous avons tir linventaire du primaire. Cette situation nest pas la mme que celle de ltude longitudinale. En effet, les manuels du collge taient systmatiquement la base de linterrogation des connaissances par QCM. Ici, ce nest pas toujours le cas et nous avons souhait ne pas nous contenter de lvaluation dun unique tablissement scolaire. Nous pensons, a priori, quil ny aura pas de diffrences entre les tablissements. Si nanmoins il en survenait, nous relativiserions les explications sy rfrant. Aussi, pour cette tude n4, deux tablissements en zones gographiques distinctes ont accueilli favorablement notre tude. Ltablissement brhannais (comptant les coles Notre Dame pour le CP et CE1 et Saint-Louis du CE2 au CM2) est un tablissement priv en milieu rural. Ltablissement de Chantepie est lui situ en milieu urbain.
2.1. Hypothses
Concernant les bonnes rponses aux QCM, nous nous attendons ce que des diffrences soient observables entre les niveaux scolaires des enfants : les lves les plus gs apprennent proportionnellement plus de mots que les lves les plus jeunes. Sils connaissent plus de mots, nous devrions constater en corollaire que chez les enfants de niveaux scolaires levs il y a gnralement moins derreurs commises dans les rponses, quelles quelles soient (erreurs formelles ou smantiques). Le choix de piges devrait donc diminuer si lon progresse dans les annes scolaires.
181
De manire plus fine, nous pensons que la nature des erreurs commises dans les QCM change en fonction du niveau scolaire de lenfant. Les enfants des premiers niveaux scolaires produiraient plus derreurs que les autres et la nature des erreurs commises serait diffrente : plus derreurs de types piges formels chez les plus jeunes que derreurs de types smantiques chez les lves les plus gs.
2.2. Remarques sur la construction des QCM

Les indications que nous donnons ici valent pour les deux tudes (4 & 5) sur les questionnaires choix multiples qui nous ont permis de raliser ces passations. Pour slectionner les items, nous avons effectu une extraction alatoire par inventaire de niveau. Quand le tirage au sort portait sur un terme polysmique distingu comme tel, la bonne rponse tait construite non pas sur le sens de plus grande occurrence mais sur le sens extrait de lchantillonnage. Par rapport au collge, nous avons d adapter quelque peu les consignes de passation et la difficult des choix de rponses. La consigne demandait aux lves de reprer le mot le plus proche du sens de celui qui leur est propos. Dans la plupart des cas, les bonnes rponses ont t conues sur la base des mots en contexte dans les manuels scolaires utiliss. Nous avons essay demployer pour ces rponses exactes les significations les plus frquemment rencontres. Les piges formels qui ont t construits reprsentent soit des voisins orthographiques soit des voisins phontiques. Toutefois, tous ces voisins nont pas t conus avec la mme rigueur : si le terme de piges lexicaux est parfois rencontr il dsigne ces piges formels. Quant aux piges smantiques qui ont t introduits dans les modalits de rponses, ils peuvent tre des propositions de sens contraire, dune catgorie diffrente mais proche ou encore sans aucune parent litem.
182
Il faut noter que lemploi dun pige formel nest bien videmment pas toujours possible. Ainsi, dans le QCM ralis il na pu tre construit systmatiquement autant de piges formels que de piges smantiques la construction des items aurait t trop artificielle. Quand il ne pouvait tre labor de pige formel, un second pige de type smantique tait propos. Cela explique que les piges smantiques sont plus nombreux que les piges lexicaux. A titre dillustration, il existe dans le QCM 100 mots du primaire que nous verrons plus avant seulement 78 piges formels pour 122 piges smantiques. Voici, extrait du QCM 100 mots du primaire, deux exemples ditems. Le premier possde un pige lexical et un pige smantique : 84. a. b. c. d.
seau
o lon met de leau idiot brouette je ne sais pas bonne rponse pige formel (sot) pige smantique
Pour le second item, il eut t difficile de construire un pige lexical sans tre artificiel : 1. a. b. c. d.
australopithque
anctre de llphant homme prhistorique dinosaure je ne sais pas pige smantique bonne rponse pige smantique
Cest pourquoi, dans les rsultats des expriences, les scores de tous les QCM pour les piges formels et smantiques ont t pondrs et ramens en pourcentage pour en faciliter la lecture.
2.3. Descriptif des expriences

Cest une tude de type papier crayon sous la forme dun cahier de questions qui a t mene. Il ntait pas envisageable dutiliser un support informatis qui aurait requis une familiarisation loutil, des conditions matrielles et dhoraires particuliers dans les tablissements scolaires et surtout un temps de passation beaucoup plus long. Nous avons
183
donc privilgi la facilit de passation aux recodages informatiss des rponses et lindication de leurs temps de rponses, somme toute peu informatifs pour notre tude. En plus des QCM, nous avons demand aux enseignants des lves de nous fournir une note de lecture et une note dapprciation gnrale, ce qui a t fait, bien que le systme de notation ne soit plus en usage au primaire. Initialement, ces notes correspondaient des apprciations A+, C-, que nous avons converti en notes scolaires daprs les indications des enseignants.
Nombre ditems par QCM en fonction des niveaux scolaires Rpondant une demande formule par les enseignants des coles, le nombre de QCM passs par un lve tait diffrent en fonction de son niveau scolaire, ce en prvision de la dure de passation totale prvue sur une quinzaine de jours. Cest pourquoi, les classes de CP nont eu quun chantillon de 100 QCM sur les 1 728 mots du CP (1/17me), les lves de CE nont eu que 200 QCM sur les 5 464 du CE (1/27me) et les plus grands (CM1 - CM2) ont pass 400 QCM sur les 9 095 mots du CM (1/22me). Cest pourquoi nous avons distingu cinq expriences correspondant aux cinq annes scolaires. Lintgralit des diffrents cahiers de QCM est consultable en Annexe 5 de ce document, page Erreur ! Signet non dfini.). Passation Sur une priode de 15 jours et pendant leurs cours, les instituteurs remettaient aux lves leurs livrets de QCM. A leurs rythmes, les enseignants ont administr en passation collective lexprience en fonction de lamnagement de leurs programmes de cours. Les enseignants nont donn dindications sur les rponses que lorsque quils avaient collect les cahiers. Gnralement, ils corrigeaient le cahier de questions en commun en reprant piges et bonnes rponses et en les expliquant.
184
De lavis de la majorit des enseignants cette formule de passation a t apprcie des lves, les enseignants layant annonc comme un exercice de vocabulaire. A noter que plusieurs professeurs des coles se sont dclars dsireux de remployer dans leurs pratiques ces cahiers de questions soit en dbut danne scolaire soit en fin danne scolaire pour valuer le vocabulaire de leurs jeunes lves. Afin que llve ne prenne pas cela comme un jeu et soit moins attentif sa rponse, la consigne sur la page des exemples du cahier lui rappelait (ainsi que lenseignant) quun systme de points sanctionnait les rponses, sans pnalits pour les non rponses. Llve devait entourer la rponse qui lui semblait la plus proche de litem. Variables dpendantes Toutes les rponses papier crayon ont ensuite t ressaisies et codes en fonction du type de rponse donne par llve dans le cahier de questions : les bonnes rponses, les erreurs de type smantiques, les erreurs de types formel quand la question en comportait et la modalit je ne sais pas . Ainsi, bonnes rponses, erreurs (regroupement des piges formels et smantiques) et ignorance des lves pourront tre analyses plus finement.
2.4. Analyse des rsultats

Par convention les donnes statistiques, F, t et les probabilits associes ont t arrondies la valeur la plus proche la troisime dcimale. Les analyses ont t ralises sous SPSS v6.0.1 et MINITAB v9.02.
2.4.1. Cours Prparatoire

coles Au total, 47 lves des deux coles ont pass nos QCM. Au niveau des bonnes rponses des lves, il nexiste aucune diffrence significative entre les deux coles
185
(F [1 ; 45] = 1.206 ; NS). De mme pour le total des erreurs (F [1 ; 45] = .02 ; NS), le pourcentage derreurs de type lexical (F [1 ; 45] = .049 ; NS), le pourcentage derreurs de type smantique (F [1 ; 45] = .211 ; NS) ou encore la modalit je ne sais pas (F [1 ; 45] = 1.69 ; NS), il ny a pas de diffrences statistiquement significatives qui soient observes. Cest pourquoi les donnes des deux tablissements ont t rassembles portant 47 le nombre de sujets en CP pour ce QCM. En moyenne un lve de CP obtient 60,53 bonnes rponses sur les 100 QCM (cart-type de 15,56) pour 20,85 erreurs (cart-type de 12,85) et 18,62 rponses o il ignore la connaissance des mots (cart-type de 14,63). Un rapide constat nous fait observer sur les modalits erreurs et je ne sais pas des cart-types relativement levs, tmoignant dune large dispersion des notes autour de ces moyennes. Lorsque lon compare les deux types derreurs en pourcentage introduits dans les QCM (piges lexicaux versus piges smantiques) il napparat pas de diffrence statistiquement significativement en CP quant au type derreurs commises par les lves (t = .60 ; dl = 46 ; NS). Les lves commettent donc en moyenne autant derreurs lexicales que de sens en CP aux QCM : 10,64 piges lexicaux contre 10,24 piges smantiques avec respectivement pour cart-types 6,94 et 6,72. Sexe Plusieurs analyses de la variance un facteur effectues sur les diffrents scores recueillis dans cette exprience donnent pour indications quil ny a pas de diffrences significatives, les deux tablissements confondus, entre garons et filles sur les scores. Que ce soit au niveau des bonnes rponses (F [1 ; 45] = .634 ; NS), au niveau des fautes releves (F [1 ; 45] = .780; NS), ou encore pour les rponses je ne sais pas (F [1 ; 45] = .005 ; NS) voire mme pour les deux types derreurs en donnes pondres : piges lexicaux
186
(F [1 ; 45] = .695 ; NS) et piges smantiques (F [1 ; 45] = .684 ; p = .NS), les sexes ne diffrent pas significativement. Corrlations Les donnes ont t regroupes, sexe et tablissements confondus. Tableau 18 Corrlations entre plusieurs indicateurs aux QCM par niveau du CP
CP (n=47) Lecture Score B - E Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques je ne sais pas Apprciation Lecture gnrale .76** .73** .69** -.55** -.52** -.51** -.25 .64** .68** -.39** -.40** -.33* -.38** .88** -.83** -.77** -.79** -.21 -.48** -.44** -.46** -.63** .93** .94** -.36* .77** -.34* -.33* Score BE Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques
* - Significatif p < .05
** - significatif p < .01
Comme Lieury, nous avons calcul un score de connaissances scolaire (B E , bonnes rponses moins les erreurs). Ce score se trouve fortement reli celui des bonnes rponses et derreurs. Son lien la lecture est fort avec .73. On trouve une corrlation importante entre les notes de lecture et dapprciation gnrale (converties daprs les indications des enseignants). Les bonnes rponses (ou lestimation du vocabulaire connu du CP) ont une corrlation importante avec la note dapprciation gnrale (.69) et avec la note de lecture (.68). Lautre corrlation importante est celle entre les erreurs commises et lapprciation gnrale des lves (-.55), que ces erreurs soient smantiques (-.51) ou lexicales (-.52). Le score B-E de Lieury (Bonnes rponses erreurs) montre des liaisons fortes avec la note
187
dapprciation gnrale (.73), la lecture (.64) et les rponses exactes (.68). Au lieu de score de mmoire encyclopdique, nous le dnommerons score de connaissances scolaires au primaire.
2.4.2. Cours lmentaire 1 r e anne

Au CE1, 43 lves ont particip lexprience. Une ANOVA un seul facteur ralise auprs des deux tablissements pour les bonnes rponses laisse apparatre une diffrence significative entre les deux moyennes des lves de ces coles (F [1 ; 41] = 4.755 ; p < .05). Cependant, les autres scores, le total des erreurs (F[1 ; 41] = .150 ; NS), les piges formels (F [1 ; 41] = 2.209 ; NS), les piges smantiques (F [1 ; 41] = .298 ; NS) et les rponses je ne sais pas (F [1 ; 41] = 2.641 ; NS) ne montrent pas de diffrences significatives dans les moyennes obtenues ces scores. Les lves de ltablissement brhannais obtiennent ainsi des scores lgrement suprieurs aux lves de Chantepie avec respectivement une moyenne de bonnes rponses aux 200 items du QCM de 133,57 (cart-type de 17,2) contre une moyenne de 121,95 (cart-type de 18,23) pour Chantepie. Le meilleur lve de Brhan a un score de 172 / 200 contre seulement 156 pour son camarade de Chantepie. De mme llve brhannais le plus faible a un score de 107 contre 92 pour son homologue de Chantepie. Toutefois, de manire apprcier dans lensemble les rsultats nous prendrons la moyenne des deux tablissements jusque et y compris pour la modalit bonnes rponses o des diffrences sont apparues. Cest donc en moyenne quelques 127,63 items auxquels les lves ont correctement rpondus (cart-type de 18,23). Les lves se trompent pour 27,51 items (cart-type de 13,82) et choisissent la modalit je ne sais pas dans 44,86 cas sur 200 (cart-type de 20,49). Si on relativise en comparant les pourcentages de ces scores, en CE1 les lves russissent 63,81 % des items pour 13,75 % derreurs contre 22,43 % de rponses o ils marquent leur ignorance de la bonne rponse. Par rapport aux items du niveau CP le
188
nombre derreurs est en diminution alors que les bonnes rponses sont en augmentation (de plus de 3 points). En nous intressant aux deux types derreurs introduites dans les QCM, on constate que la diffrence entre les moyennes des erreurs formelles et des erreurs smantiques nest pas significative (t = -.83 ; dl = 42 ; NS). Des erreurs formelles sont rencontres pour 13,45 items contre 14,04 pour les erreurs smantiques, soit respectivement 6,73 % et 7,02 % des items. Concernant la variable sexe, aucun des scores ne tmoigne dune diffrence significative entre garons et filles, que ce soit les rponses correctes (F [1 ; 41] = .002 ; NS), les fautes commises (F [1 ; 41] = .593 ; NS) quelles soient lexicales (F [1 ; 41] = 1.690 ; NS) ou de sens (F [1 ; 41] = .068 ; NS) ou encore les rponses dignorance des sujets (F [1 ; 41] = .228 ; NS). Rien ne permet de conclure une diffrence entre les genres.
Tableau 19 Corrlations entre plusieurs indicateurs aux QCM par niveau du CE1
CE1 (n=43) Lecture Score B E Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques je ne sais pas Apprciation Lecture gnrale .89** .49** .43** -.33* -.31* -.32* -.15 .76** .78** -.40 -.50* -.30 -.35 .84** -.70** -.80** -.54** -.27 -.20 -.38** -.03 -.75** .93** .95** -.49** .79** -.28 -.61** Score BE Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques
Lexamen de ces rsultats indique une corrlation encore plus forte entre lecture et apprciation gnrale que pour le CP (.89). Ici, la liaison entre bonnes rponses et apprciation gnrale est moindre quavec la lecture (respectivement, .43 et .78). Ici, le score
189
de connaissances scolaires est moins fortement corrl avec lapprciation gnrale mais reste lev avec la lecture et les rponses exactes
2.4.3. Cours lmentaire 2me anne

Leffectif total admet 45 lves. Une analyse de variance un facteur ayant pour critre la variable cole ne fait pas apparatre de diffrences significatives entre les moyennes des lves des deux tablissements scolaires pour les bonnes rponses (F [1 ; 43] = .223 ; NS). Pourtant, au seuil considr de .05, les lves des deux tablissements se distinguent pour le total des erreurs commises (F [1 ; 43] = 5.419 ; p = .025) et pour les scores corrigs des erreurs de type smantique (F [1 ; 43] = 6.089 ; p = .018). Au seuil de significativit de .05, la diffrence constate entre les deux moyennes aux erreurs lexicales nest pas significative (F [1 ; 43] = 3.609 ; NS) ainsi que pour les rponses je ne sais pas (F [1 ; 43] = 3.232 ; NS). Ainsi, les lves ont-ils une russite moyenne au QCM de 155,69 pour un cart-type de 12,84. Ils se distinguent au niveau des erreurs, les lves brhannais commettant en moyenne plus derreurs que leurs camarades de Chantepie, respectivement 35,95 contre 27,33 pour des cart-types de 13,11 et 11,73. La modalit je ne sais pas indique que les lves de Brhan rpondent plus souvent aux items bonnes rponses et piges que les lves de Chantepie. Rapport aux pourcentages et tous les lves confondus, le nombre de bonnes rponses reprsente 77,84 % des rponses, les erreurs comptant pour 15,68 % et les rponses marquant lignorance de la solution 6,48 % des items. L encore on note une progression par rapport au CE1. Toutefois, on remarque une augmentation du nombre derreurs pour les classes de CE2 vis--vis des classes de CE1, sur les mmes QCM du Cours lmentaire.
190
En se concentrant sur les deux types derreurs pour tous les lves (en donnes pondres quant leur nombre respectif pour les 200 items), une diffrence significative est observe entre leurs deux moyennes (t = -2.30 ; dl = 44 ; p = .026). Il est commis plus derreurs smantiques que derreurs lexicales, avec pour les erreurs smantiques une moyenne de 16,41 (cart-type de 6,84) contre une de 14,88 pour les piges formels (cart-type de 6,90). Mais, cette diffrence nest plus significative si lon observe uniquement ltablissement brhannais (t = -1.97 ; dl = 20 ; NS) ou encore celui de Chantepie (t = -1.25 ; dl = 23 ; NS). On observe sur une analyse de la variance un facteur une diffrence significative entre garons et filles concernant les bonnes rponses, les garons obtenant sensiblement de meilleurs scores quant aux rponses correctes, avec une moyenne de 159,81 (erreur standard de 13,12) contre 150,05 (cart-type de 10,28) pour les filles (F [1 ; 43] = 7.239 ; p = .01). Toutefois ces jeunes demoiselles rpondent plus souvent je ne sais pas que les garons (moyenne de 20,58 avec un cart-type trs important de 15,04 contre une moyenne de 7,38 et une erreur standard elle aussi trs importante de 7,51 pour les garons). Cette diffrence est statistiquement significative (F [1 ; 43] = 14,999 ; p = .001). Ni les erreurs lexicales (F [1 ; 43] = .372 ; NS), ni les fautes sur la signification des mots (F [1 ; 43] = 1,063 ; NS) ne mettent en relief dautres diffrences entre garons et filles.
191
Tableau 20 Corrlations entre plusieurs indicateurs aux QCM par niveau du CE2
CE2 (n=45) Lecture Score B E Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques je ne sais pas Apprciation Lecture gnrale .85** .72** .55** -.68** -.74** -.55** .14 .63** .66** -.52 -.58* -.40 -.25 .86** -.86** -.83** -.80** .01 -.49** -.49** -.44** -.49** .94** .95** -.51** .79** -.45** -.51** Score BE Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques
La corrlation entre lecture et apprciation gnrale demeure trs importante avec .85. Ici au CE1, on observe que les bonnes rponses (et donc lestimation du lexique) sont plus corrles avec la note de lecture (.66) quavec la note dapprciation gnrale (.55). Ce sont en fait les erreurs avec -.68 qui sont les plus corrles avec la note dapprciation gnrale et tout particulirement les erreurs lexicales (-.74).
2.4.4. Cours Moyen 1 r e anne

Sur les 400 items auxquels ont t soumis ici les 48 lves des deux coles, le score de bonnes rponses est de 286,02 pour 46,58 erreurs et 67,40 rponses je ne sais pas pour des cart-types qui sont par ordre prcit de 40,96, de 27,46 et enfin de 42,06. Il est facile dobserver une fois encore ici la grande variabilit des rponses de modalits je ne sais pas qui offre une grande dispersion autour de la moyenne. Ramenes en pourcentage, les bonnes rponses reprsentent 71,51 % des rponses contre 11,65 % pour les erreurs. Une ANOVA un facteur avec pour modalits les deux tablissements fait apparatre une diffrence significative au niveau des bonnes rponses quant aux moyennes des deux
192
coles (F [1 ; 46] = 8.62 ; p = .005). Les lves de Brhan ont un score moyen de bonnes rponses qui est de 302,13 pour un cart-type de 44,12 alors que Chantepie a une moyenne de 269,92 et un cart-type de 30,65. Pareillement on retrouve une diffrence significative entre les moyennes pour les scores des rponses je ne sais pas (F [1 ; 46] = 10.377 ; p = .002). Pareillement aux rsultats recueillis en CE2, les lves brhannais choisissent moins les rponses je ne sais pas que les lves de Chantepie (moyenne de 49,54 contre 85,25). Cette fois-ci le nombre derreurs commises est identique statistiquement (F [1 ; 46] = .192 ; NS) mais pas le nombre de bonnes rponses. Lassiette des modalits joue ici en faveur des rponses exactes pour lcole brhannaise. Au niveau des types derreurs commises, les coles ne diffrent pas sensiblement lune de lautre, ni pour les piges lexicaux (F [1 ; 46] = .042 ; NS) ni pour les piges smantiques (F [1 ; 46] = .489 ; NS). Cependant, les deux types derreurs diffrent lune de lautre, un t de Student sur mesures appareilles faisant apparatre des diffrences significatives entre les deux moyennes (t = 4.94 ; dl = 47 ; p < .0001). Les erreurs lexicales sont ici plus importantes que les erreurs smantiques. Toutefois restons prudent : en effet, alors que pour le CP et le CE le rapport piges formels / piges smantiques tait relativement constant de lordre de 92 % en CP et de 96 % en CE pour les piges formels, il y a beaucoup moins de piges lexicaux pour le CM (seulement 193 piges formels pour 607 piges smantiques pour les 400 items, soit 48,25 %). La construction des items a sans doute t moins rigoureuse sur ces 400 items. Aussi, la pondration de ces items par rapport aux autres se trouve plus importante. Si cart il y a, ces carts sont accrus. La statistique nous renseigne pour partie de cette pondration particulire. Plusieurs analyses de la variance un facteur ont t menes afin de vrifier sil existait ou non des diffrences entre les genres aux scores du QCM. Seules les rponses je ne sais
193
pas relvent une diffrence significative entre garons et filles (F [1 ; 46] = 4.149 ; p = .047). Les autres variables ne mettent pas en vidence une telle diffrence, que ce soit vis-vis des rponses correctes (F [1 ; 46] = 3.978 ; NS) ou des erreurs commises (F [1 ; 46] = .018 ; NS) quelles soient formelles (F [1 ; 46] < .0001 ; NS) ou smantiques (F = .034 ; NS).
Tableau 21 Corrlations entre plusieurs indicateurs aux QCM par niveau du CM1
CM1 (n=48) Lecture Score B E Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques je ne sais pas Apprciation Lecture gnrale .90** .53** .36** -.52** -.49** -.52** -.015 .49** .29* -.55** -.52** -.54** .07 .88** -.71** -.75** -.66** -.39** -.29* -.38** -.24 -.78** .94** .99** -.36* .89** -.24 -.40** Score B-E Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques
Une fois encore, note de lecture et apprciation gnrale sont trs fortement corrles avec une liaison de .90. Les bonnes rponses par rapport lanne antrieure (CE2) chutent encore au niveau des corrlations avec la lecture et lapprciation gnrale. Toutefois les erreurs, dans leur ensemble, demeurent bien corrles avec ces notes (-.52 avec lapprciation gnrale et -.55 avec la note de lecture).
2.4.5. Cours Moyen 2 m e anne

Si lon observe les rsultats au CM2, les 51 lves obtiennent un score de 313,29 bonnes rponses pour les 400 items (cart-type de 28,08). Les erreurs rencontres, lexicales et
194
smantiques, sont en moyenne de 35,55 (cart-type de 17,12). En pourcentage, on obtient une russite aux QCM de lordre de 78,32 % pour 8,89 % derreurs. Les analyses de variance un seul facteur dont les critres sont les deux tablissements scolaires nindiquent pas de diffrences significatives entre les moyennes des scores aux bonnes rponses (F [1 ; 49] = .670 ; NS) ni aux erreurs des deux types (F [1 ; 49] = .568 ; NS) ni pour la modalit de rponse je ne sais pas (F [1 ; 49] = .129 ; NS). Une diffrence significative est observe cependant entre les moyennes pondres des deux types derreurs (t = 3.83 ; dl = 50 ; p = .0001). Les mmes rserves quant la pondration des piges lexicaux sont donner ici pour relativiser le plus grand nombre derreurs de type lexicale commises (moyenne de 21,62 pour un cart-type de 13,45) par rapport aux erreurs de sens rencontres (moyenne de 16,55 avec un cart-type de 7,78). Lexamen des moyennes aux bonnes rponses ne permet pas de conclure des diffrences entre garons et filles (F [1 ; 49] = .925 ; NS). Les autres variables ne rapportent pas non plus de diffrences significatives.
Tableau 22 Corrlations entre plusieurs indicateurs aux QCM par niveau du CM2
CM2 (n=51) Lecture Score B E Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques je ne sais pas Apprciation Lecture gnrale .94** .60** .40* -.70** -.56** -.68** -.02 .71** .49** -.79** -.63** -.76** -.06 .89** -.68** -.68** -.62 -.47 -.29* -.36** -.22 -.81** .88** .96** -.31* .72** -.16 -.35** Score BE Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques
195
La corrlation entre lecture et apprciation gnrale reste toujours importante (.94). Celle entre lecture et russite aux QCM (.49) est plus forte quen CM1. Lapprciation gnrale demeure trs bien corrle avec les erreurs (-.70), ces dernires plus encore avec la lecture (-.79).
2.5. Synthse de ltude

Nous avons rsum ici les principales informations de cette tude n4. Pour faciliter les comparaisons, les tableaux et graphiques ci-aprs rutilisent les pourcentages des bonnes rponses, derreurs et de rponses marquant lignorance des lves des rponses appropries aux diffrents QCM. Les cahiers de passation qui ont t administrs navaient pas le mme nombre ditems. Cest par commodit que nous utilisons des pourcentages pour reprsenter ces rsultats des QCM par niveau scolaire. Toutefois, les plafonds de vocabulaire ne sont pas identiques selon les niveaux tudis (CP, CE et CM). Aussi, cest arbitrairement pour un confort de lecture que des courbes relient les points CP CE1 et CE2 CM1.
Tableau 23 Rsums des rponses aux QCM par niveau pour les 5 annes du primaire Niveaux Scolaires Cours Prparatoire ...... Cours lmentaire 1 ... Cours lmentaire 2 ... Cours Moyen 1 ........... Cours Moyen 2 ........... Bonnes rponses 60,53 63,82 77,84 71,5 78,32 20,85 13,76 15,68 11,65 8,89 Erreurs "Je ne sais pas" 18,62 22,43 6,48 16,85 12,79 piges lexicaux 10,64 6,73 7,44 6,95 5,4 piges smantiques 10,24 7,02 8,21 5,47 4,14
Dune manire gnrale, les enfants (garons comme filles) progressent danne en anne dans la matrise du vocabulaire. Les erreurs smantiques et formelles, dabord nombreuses au CP, diminuent et sont divises par deux en fin de CM2. Mais nous navons pas
196
pu relever la trace dune inversion des patterns de ces deux types derreurs en fonction des niveaux scolaires. Cette absence de diffrences entre piges formels et smantiques provient peut-tre de la sur-reprsentation des piges smantiques dans notre tude. Les rponses marquant lignorance ne prsentent pas dintrt dans leur volution au cours des cinq annes. Figure 20 Reprsentation graphique des pourcentages de diffrents scores au QCM par niveau
90 80 70
Pourcentage
Bonnes rponses Erreurs "je ne sais pas" piges lexicaux piges smantiques
60 50 40 30 20 10 0 CP CE1 CE2 CM1 CM2
Lexamen des corrlations nous a montr que le lien entre lecture et apprciation gnrale tait trs fort et quil semblait crotre du CP (.76) au CM2 (.94). Les bonnes rponses sont sensiblement mieux corrles avec la lecture quavec lapprciation gnrale. Cela conforte notre ide que la lecture est importante au primaire dans lapprentissage du vocabulaire et bien sr ncessaire pour passer les QCM. Mme si les corrlations baissent avec le niveau scolaire, le score de connaissances scolaires (R-E) de Lieury est fortement corrl avec les notes dapprciation gnrale et de lecture (et a fortiori plus encore avec les bonnes rponses et les erreurs). Il est donc utile demployer cet indicateur au primaire.
197
Estimation du vocabulaire Une estimation de ltendue du lexique de vocabulaire connue t ralise. Pour cela chaque bonne rponse a t multiplie par le ratio dchantillonnage des items. Ainsi pour le QCM de 100 mots du CP le meilleur lve qui obtenait 88 bonnes rponses sur les 100 items sest vu estim 1511,84 le nombre de mots quil connaissait sur les 1728 mots que contenaient ces manuels de lanne (88 /100*1718). Tableau 24 Estimation du vocabulaire acquis au primaire par les QCM de niveau Niveau scolaire / Moyenne Plafond du lexique CP ........................ 1 718 CE1 ...................... 5 464 CE2 ...................... 5 464 CM1 ..................... 9 095 CM2 ..................... 9 095 1 039,94 3 486,79 4 253,42 6 503,40 7 123,53 cart-type 267,25 497,94 350,68 931,26 638,52 Minimum Maximum tendue 188,98 2 513,44 3 688,20 4 843,09 5 343,31 1 511,84 4 699,04 4 917,60 8 867,63 8 140,03 1 322,16 2 185,60 1 229,40 4 024,54 2 796,71
Figure 21
Reprsentation graphique de lestimation du vocabulaire acquis au primaire par les QCM de niveau
Moyenne 12 000 11 000 10 000 9 000 8 000

Nb de mots
Min
Max
9 095
7 000 6 000 5 000 4 000 3 000 2 000 1 000 CP CE1 CE2 Niveaux scolaires CM1 CM2 1 718 5 464
198
Ces estimations indiquent classiquement une croissance rgulire des carts entre les lves connaissant le plus de mots et ceux qui en ont le moins. Lcart est proportionnellement trs important au CP, montrant que les niveaux individuels de lecture y sont trs htrognes. Au final, nous aurons observ trs peu de diffrences entre les deux tablissements scolaires de ltude. Le fait que les deux coles ne disposent pas toujours des manuels que nous avions incorpors notre inventaire na pnalis aucune dentre elles. La construction de QCM partir de manuels scolaires mme non en usage dans un tablissement donn semble satisfaisante pour ltude du vocabulaire au primaire.
199
3. E STIM ATION DES CONNAI SSANCES SCOLAIRES PAR QCM SUR LA TOTALIT DU PRIMAIRE ( TUDE N 5)
Les six expriences de cette tude ont t construites pour suivre la progression de lacquisition dun chantillon de mots par les lves. Ces mots ici ne font plus partie du recensement par niveau mais sont chantillonns sur la base de toutes les entres lexicales distinctes rencontres au primaire, soit le total des 11 095 mots lissue du CM2 pour les 10 ouvrages considrs. Nos hypothses de travail seront les mmes que celles de ltude n4.
3.1. Descriptif des expriences

Comme dans ltude n4, le QCM a t administr sous la forme papier crayon dun livret de questions. Seuls les items et la page de garde ont t modifis. Les rsultats de ltude prcdente nayant pas montr de diffrences entre les tablissements scolaires, nous navons conserv que lcole de Chantepie (35) gographiquement la plus proche du laboratoire. Nombre ditems par QCM en fonction des niveaux scolaires Nous avons suivi nouveau les indications des enseignants et construit des cahiers de passations dont le nombre de questions dpendait de lge des lves. Comme nous interrogions des items extrait cette fois-ci de linventaire total du primaire, la classe de CP na eu quun chantillon de 100 mots sur les 11 095 du Primaire (1/111me), les lves de CE nont eu que 200 mots (1/55me) et les plus grands (CM1 - CM2) ont pass 400 mots (1/27me). Pour raliser cette tude, 400 mots de linventaire du Primaire ont donc t tirs au hasard. Ils ont fait lobjet de la construction de nouveaux QCM : bonnes rponses, erreurs, et modalit je ne sais pas . Mais, par conomie, quand les items taient identiques ceux des
200
chantillons de ltude n3 prcdente, nous reprenions les QCM dj raliss. Sachant que les 100 mots du CP se retrouvent dans les 200 du CE et les 400 du CM, il nous a t possible de pister sur ces cinq annes la progression des connaissances sur ces mots. Nous avons inclus une classe de 6me du collge des Hautes Ourmes pour vrifier si ce vocabulaire courant du primaire tait intgralement connu aprs un an au collge. Passation De la mme manire, les instituteurs remettaient aux lves leurs livrets de QCM, administrs en passation collective durant les enseignements. La consigne de la page des exemples du cahier rappelait llve quun systme de points tait utilis afin quil ne prenne pas lexprience pour un jeu ou mette ses rponses par trop au hasard. Il devait entourer la rponse la plus proche de litem.
3.2. Cours Prparatoire

23 lves ont particip lexprience. Les rsultats indiquent que les lves russissent en moyenne 40,96 items sur les 100 proposs pour un cart-type de 15,30. Le meilleur lve de CP obtient la note de 70 sur 100 alors que le plus faible ne russit que 10 items. En moyenne, ce sont quelques 17,22 erreurs qui sont commises (cart-type de 13,10). Avant correction des scores pour les deux types derreurs, les piges lexicaux taient au nombre de 78 pour 122 piges smantiques. En donnes corriges, les lves commettent 9,48 erreurs smantiques (cart-type de 8) pour 7,25 erreurs formelles (cart-type de 5,08). Statistiquement, ils font plus derreurs smantiques que derreurs lexicales (t = -2.10 ; dl = 22 ; p = .048). En convertissant le nombre de bonnes rponses en estimation du vocabulaire connu par les lves on obtient sur les 11 095 mots de linventaire de tout le primaire une connaissance moyenne de 4 544 mots avec un cart-type de 1 697. Nos lves, respectivement le meilleur et
201
le plus faible aux QCM voient leurs vocabulaires estims 7 767 mots pour le premier contre seulement 1 110 mots pour le second (tendue de 6 657 mots). Une analyse de la variance un facteur opre sur les diffrentes variables dpendantes de lexprience entre garons et filles fait apparatre une diffrence significative entre les sexes, au bnfice des filles (F [1 ; 21] = 5.661 ; p = .027). Elles russissent en moyenne 49,56 items (cart-type de 10,54) contre seulement 35,43 pour les garons (cart-type de 15,61). Ds lors leurs erreurs sont galement moins nombreuses, de lordre de 9,22 (cart-type de 3,67) contre 22,36 (cart-type de 14,48) pour leurs camarades de lautre sexe (F [1 ; 21] = 7.001 ; p = .015). Il ny a pas de diffrence entre les deux types derreurs commises (t = .71 ; dl = 8 ; NS) alors que la diffrence entre les deux modalits est significative chez les garons qui commettent plus derreurs smantiques que de fautes lexicales (t = -3.12 ; dl = 14 ; NS).
Tableau 25 Corrlations entre plusieurs indicateurs aux QCM sur le primaire pour le Cours Prparatoire
CP (n=23) Lecture Score B E Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques je ne sais pas Apprciation Lecture gnrale .83** .78** .60** -.57** -.36 -.62** -.09 .76** .67** -.45* -.17 -.53** -.23 .79** -.70** -.50** -.74** -.15 -.13 .05 -.19 -.72** .88** .98** -.59** .78** -.66** -.52* Score BE Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques
202
Nous constatons que notes dapprciation gnrale et de lecture demeurent trs fortement corrles avec .83. Les rponses exactes (converties ou non en nombre de mots connus) montrent des corrlations importantes avec lapprciation gnrale en CP (.60) mais surtout avec la note qui est donne de la matrise de la lecture (.67). Le score B-E (ou R-E pour Russite moins Erreurs) de connaissance scolaire offre encore des liaisons fortes avec les notes scolaires, les bonnes rponses et les erreurs surtout quand elles sont smantiques. Comme indiqu dans ltude n3, les erreurs affichent des coefficients de liaisons forts avec lapprciation gnrale (-.57) mais un peu plus faible avec la lecture (-.45). Les erreurs lexicales nont pas de corrlations significatives avec la lecture et la note dapprciation alors que les erreurs smantiques en ont avec respectivement -.62 avec lapprciation gnrale et -.53 avec la lecture.
3.3. Cours lmentaire 1 r e anne

Si nous souhaitons comparer le CE1 au CP ainsi quaux autre classes, il est plus ais de le faire via le suivi des 100 items. Aussi, de manire arbitraire nous ne traiterons que ces 100 QCM communs toutes les expriences. La moyenne des rponses pour les 27 lves de cette classe est de 62,30 mots (carttype de 10,17). Le meilleur lve a le score de 78 bonnes rponses pour 100 items alors que le plus faible nen obtient que 35, soit plus de deux fois moins. Au niveau des erreurs comptabilises, la moyenne est de 15,78 pour une erreur standard de 9,10 ce qui est important pour une dispersion autour de la moyenne. Les erreurs lexicales sont les plus nombreuses avec une moyenne de 8,83 (cart-type de 4,94) alors que les erreurs de signification se chiffrent 7,29 en moyenne avec un cart-type de 4,71 (t = 2.54 ; dl = 26 ; p = .017). Il nexiste aucune diffrence qui soit significative au niveau des moyennes des sujets de CE1 entre les sexes (bonnes rponses : F [1 ; 25] = .596 ; NS ; le total des erreurs :
203
F [1 ; 25] = .669 ; NS ; les erreurs formelles : F [1 ; 25] = 1.661 ; NS ; les erreurs smantiques : F [1 ; 25] = .196 ; NS). Lestimation du vocabulaire connu donne en moyenne une connaissance de 6 912 mots en CE1 (cart-type de 1 129). Llve qui connat le plus de mots a un lexique valu 8 654 mots contre 3 883 pour le plus faible.
Tableau 26 Corrlations entre plusieurs indicateurs aux QCM sur le primaire pour le Cours lmentaire 1re anne
CE1 (n = 27) Lecture Score B E Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques je ne sais pas Apprciation Lecture gnrale .82** .49* .59** -.19 -.10 -.24 -.41 .29 .36 -.00 .00 -.01 -.37 .92** -.74** -.79** -.65** -.26 -.50** -.60** -.39* -.57** .92** .96** -.41* .78** -.22 -.49** Score BE Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques
Sur cet chantillon de 100 items, les deux notes scolaires gardent le mme lien troit avec une corrlation de .82. Alors que la corrlation entre apprciation gnrale et rponses exactes aux QCM baisse mais reste importante (.59), la corrlation entre ces russites aux QCM et la lecture nest plus significative. Les erreurs (formelles et smantiques) nont plus de liens qui soient statistiquement significatifs avec la lecture ou lapprciation gnrale.
3.4. Cours lmentaire 2 m e anne

Notre effectif de sujets est ici plus petit avec 22 lves. Ceux-ci russissent en moyenne 75,41 % des items (cart-type de 10,52). Ils commettent ainsi 12,05 erreurs (5,71 dcarttype). Le meilleur ralise un score de 90 % contre 50 % pour le dernier. Il nexiste pas de
204
diffrence observe entre erreurs lexicales et smantiques ici, les sujets commettant en moyenne 6,15 erreurs smantiques (cart-type de 2,80) contre 5,83 erreurs lexicales (carttype de 3,55). Un t sur donnes appareilles nindique pas de diffrences aut res que celles lies aux fluctuations du hasard (t = -.59 ; dl = 21 ; p = .561). Plusieurs ANOVA un facteur sur les variables rponses correctes et les deux types derreurs ne nous permettent pas dobserver de diffrences dans les scores entre garons et filles. Les estimations de connaissances du vocabulaire atteignent en moyenne 8 367 mots (cart-type de 1 167) avec 9 985 mots pour le meilleur et 5 548 pour le plus faible. Au niveau des corrlations, nous constatons quelles sont ici plus leves que dordinaire. La liaison la plus forte est celle entre le score de connaissance scolaire et les bonnes rponses (.94). Tableau 27 Corrlations entre plusieurs indicateurs aux QCM sur le primaire pour le Cours lmentaire 2me anne
CE2 (n = 22) Lecture Score B E Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques je ne sais pas Apprciation Lecture gnrale .88** .82** .82** -.77** -.69** -.72** -.56** .84** .80** -.80** -.78** -.71** -.50* .94** -.83** -.85** -.70** -.67** -.71** -.72** -.60** -.84** .90** .93** .23 .69** .32 .12 Score BE Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques
3.5. Cours Moyen 1 r e anne

Les 24 lves de CM1 progressent encore par rapport au CE2 puisquils russissent 79,21 % des items (cart-type de 10,55). Celui qui parvient au score le plus lev a la note de 91 % pour seulement 50 % pour le dernier cette preuve. Les erreurs atteignent un total
205
moyen de 11,38 % avec une erreur standard de 8,21 ce qui est trs grand et tmoigne dune grande variabilit interindividuelle. De la mme manire que pour le CE2, cet chantillon de 100 mots ne fait pas apparatre de diffrence significative entre les deux types derreurs lexicales et smantiques. Garons et filles ont des scores semblables pour toutes les variables tudies (bonnes rponses : F [1 ; 22] = 1.840 ; NS ; le total des erreurs : F [1 ; 22] = .617 ; NS ; les erreurs formelles : F [1 ; 22] = .060 ; NS ; les erreurs smantiques : F [1 ; 22] = 1.008 ; NS). En appliquant le coefficient multiplicateur 110,95 (11 095 mots du lexique / 100 items), nous obtenons une moyenne de mots connus en CM1 value 8 788 pour une erreur standard de 1 170. Plus de 4 500 mots sparent le meilleur sujet du plus faible, sujets dont les lexiques sont estims respectivement 10 096 mots pour le premier et 5 548 mots pour le second. En CM1, la note de lecture na pu tre donne pour les lves. Tableau 28 Corrlations entre plusieurs indicateurs aux QCM sur le primaire pour le Cours Moyen 1re anne
CM1 (n = 24) Score R E Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques je ne sais pas Apprciation Score gnrale RE .69** .54** -.60** -.66** -.49* -.11 .89** -.88** -.76** -.84** -.29 -.70** -.62** -.66** -.63** .85** .95** -.09 .66** -.06 -.10 Bonnes rponses Erreurs Erreurs Erreurs lexicales smantiques
206
Bien que plus faible en CM1 quen CE2, le lien entre bonnes rponses et apprciation gnrale demeure avec .54. Mme si nous ne disposons pas de la note de lecture des lves, il est plus que probable que la corrlation avec lapprciation gnrale se maintienne. Les erreurs ont ici des corrlations plus importantes (hormis les erreurs smantiques avec -.49) avec lapprciation gnrale (-.60) que cette dernire avec la russite aux QCM (.54).
3.6. Cours Moyen 2 m e anne

La classe examine accueille 21 lves. Leurs scores en CM2 montrent encore une volution par rapport aux niveaux scolaires antrieurs. Un sujet moyen parvient 80,25 % de rponses correctes pour un cart-type de 9,19. On observe un quasi sans faute du meilleur lve avec 98 % de rponses exactes alors que le dernier au QCM ralise un 64 % honorable. Les erreurs sont au nombre de 6,52, valeur en rgression pour une erreur standard de 3,97. Une fois encore, notre chantillon de 100 mots ne fait pas apparatre de diffrence significative entre erreurs lexicales et erreurs smantiques (t = 2.06 ; dl = 20 ; p = .053). Le facteur sexe na pas dincidence non plus sur les rponses des lves aux QCM : toutes les analyses de variance effectues nous donnent une probabilit suprieure .05. Lestimation du vocabulaire connu porte 8 913 (cart-type de 1 019) le nombre de mots quun enfant au CM2 connatrait. Ici, le meilleur lve atteint donc quasiment le plafond des 11 095 mots de linventaire avec une estimation de son vocabulaire 10 873 mots contre 7 100 mots pour llve ayant le score de russite le plus faible. En CM2 il na pas t possible non plus de collecter une note de lecture pour les lves. La corrlation entre apprciation gnrale et bonnes rponses aux QCM chute encore (.44) par rapport aux annes prcdentes. Il faut sinterroger, dans la dure des cycles du Primaire, sur la dfinition dapprciation gnrale donne par les enseignants, quant sa proximit ou non avec des apprentissages de vocabulaire.
207
Tableau 29 Corrlations entre plusieurs indicateurs aux QCM sur le primaire pour le Cours Moyen 2me anne
CM2 (n = 21) Score R E Bonnes rponses Erreurs Erreurs lexicales Erreurs smantiques je ne sais pas Apprciation Score gnrale RE .62** .44* -.40 -.34 -.33 -.28 .87** -.56** -.54. -.40 -.68** -.36 -.37 -.24 -.90** .80** .85** -.06 .38 .03 -.13 Bonnes rponses Erreurs Erreurs Erreurs lexicales smantiques
3.7. Sixime de collge

Nous nous sommes intress de manire exploratoire la classe de Sixime pour y observer le pourcentage de vocabulaire du primaire que possdaient les collgiens. Il nous a t possible dobtenir non plus une note dapprciation gnrale mais lensemble des notes des lves dans les diverses matires scolaires en 6me. Mais, avant de regarder les corrlations calcules avec ces nouveaux scores, examinons la russite aux questionnaires du primaire. Les 42 lves (deux classes) de Sixime ont russi en moyenne 82,83 % des items (cart-type de 6,87). Lamplitude des scores varie entre 94 % de bonnes rponses et 64 %. Sil ny a pas de diffrence entre garons et filles au nombre de rponses exactes, des diffrences significatives sont rencontres pour les erreurs (F [1 ; 40] = 4,31 ; p < .05). Un lve en Sixime connatrait en moyenne 9 190 mots du vocabulaire courant scolaire. Cela est une progression par rapport aux annes antrieures mais nous remarquons que le vocabulaire propos au primaire nest pas toujours pleinement connu.
208
Tableau 30 Corrlations entre plusieurs matires scolaires de la 6me et le QCM sur la totalit du primaire
6me (n = 42) Note 6e .56** .93** -.71** -.54** -.65** .58** .56** .75** .46** .60** -.42** .27 -.41** .61** .51** .76** .43** .65** .82** .83** -.30 -.43** -.41** -.34* -.25 .38* -.18 -.31* -.30* -.21 -.14 -.31* -.39** -.37* -.35* -.27 .62** .76** .59** .77** .75** .69** .62** .73** .81** .67** RE B. Rep Erreurs E. form. E. sm. Franais Biologie Histoire Maths
RE
Bonne rp. .59** Erreurs Erreurs formelles Erreurs smant. Franais Biologie Histoire Maths Technique
-.28 -.15 -.32* .91** .74** .85** .73** .85**
Par rapport au Cours Moyen, ce tableau de corrlations nous permet dobserver une liaison plus forte entre la russite aux QCM et ici la moyenne gnrale des lves. Si les bonnes rponses aux QCM et le score de connaissance scolaire sont lis la moyenne gnrale en 6me, leurs corrlations sont bien plus faibles que celles du franais (.91), de lhistoire et de la technologie (.85), de la biologie (.74) ou des mathmatiques (.73) avec la russite scolaire. Comme lindique Lieury (1996), les matires scolaires que nous venons de citer sont de bonnes prdictrices de la moyenne gnrale. Elles sont meilleures encore que notre score de connaissances scolaires. Toutefois, les disciplines scolaires se fondent sur un contrle continu et de multiples examens alors que les 100 QCM nont t administrs quen une seule passation de 25 minutes. A la diffrence du score de mmoire encyclopdique (RE/2) de Lieury, notre score de connaissance scolaire pour le vocabulaire courant est moins
209
bien corrl la moyenne gnrale (rR-E = .56 contre rR-E/2 = .71, chez Lieury en 1996). On remarquera la corrlation importante entre la russite aux QCM et la discipline de lhistoire (.76), alors que la liaison entre le franais et les bonnes rponses est moindre (.61).
3.8. Synthse de ltude

Le graphique ci-aprs rsume la progression des lves dans leur matrise des mots de notre chantillon de vocabulaire du primaire. Le fait que les lves connaissent au CP plus de 40 % des mots indique quils ont des savoirs antrieurs importants en vocabulaire. La progression est rapide entre le CP et le CE2 comme certains auteurs lont fait remarquer. La courbe progresse plus lentement alors jusquen Sixime montrant sans doute un effet plafond par rapport au nombre de questionnaires administrs et la taille du lexique du primaire. Si la connaissance des mots crot rapidement, lignorance des rponses baisse trs nettement du CP au CE2. Les erreurs, quant elles, diminuent rgulirement, sans marquer de prminence dun type derreurs sur lautre en fonction des annes. Notre hypothse dun plus grand nombre derreurs formelles dans les premires annes de la scolarit ne sest pas trouve confirme. De mme, nous navons pas rencontr de diffrences lies au genre des lves dans lacquisition du vocabulaire. Comme plusieurs auteurs lont not, la supriorit des jeunes filles pour le vocabulaire sestompe aprs lge de 4 ou 5 ans (Huttenlocher & coll., 1991) et nest plus reprable quand on mesure les rpertoire lexicaux (Anglin, 1993).
210
Figure 22
100 90 80 70 60 50 40 30 20 10 0
Progression des lves dans la connaissance des 100 mots du primaire
Bonnes rponses Erreurs "je ne sais pas" Erreurs lexicales Erreurs smantiques
CP
CE1
CE2
CM1
CM2 6me
Estimation du vocabulaire Les estimations de ltendue du lexique de mots connus ont t rsumes dans les Tableau 31 et Figure 23 de cette page. Pour cela, chaque bonne rponse a t multiplie par le ratio dchantillonnage des items. Ainsi pour le QCM de 100 mots du CP le meilleur lve qui obtenait 70 bonnes rponses sur les 100 items sest vu estim 7 766 le nombre des mots quil connaissait sur les 11 095 mots contenus sur la totalit des manuels inventoris. (70 / 100 11 095).
211
Tableau 31 Estimation du vocabulaire courant des lves aux QCM du primaire Niveau scolaire / Moyenne Lexique de 11 095 mots CP ................................. CE1 ............................... CE2 ............................... CM1 .............................. CM2 .............................. Sixime .......................... 4 544,13 6 911,77 8 366,64 8 788,16 8 912,98 9 190,36 cart-type 1 697,37 1 128,88 1 167,00 1 170,07 1 019,49 762,77 Minimum Maximum tendue 1 109,50 3 883,25 5 547,50 5 547,50 7 100,80 7 100,80 7 766,50 8 654,10 9 985,50 10 096,45 10 873,10 10 429,30 6 657,00 4 770,85 4 438,00 4 548,95 3 772,30 3 328,50
Figure 23
Estimation du dveloppement du vocabulaire courant au primaire et en 6me

12 000 11 000 10 000 9 000 11 095
Nbre de mots
8 000 7 000 6 000 5 000 4 000 3 000 2 000 1 000 CP CE1 CE2 CM1 CM2 Sixime Niveaux scolaires Max Min Moyenne
Cette courbe prsente une allure lgrement diffrente de celle estimant la connaissance anne aprs anne du vocabulaire des manuels du primaire (Cf. Figure 21, page 196). Elle indique que lacquisition du vocabulaire courant double en moyenne sur les six annes tudies. Toutefois, mme parvenus en Sixime, les lves nont pas atteint lobjectif des 11 095 mots des manuels du primaire. Nous savons que des milliers de mots nouveaux les
212
attendent dans les ouvrages disciplinaires du collge et que la quantit de vocabulaire courant dont ils disposent jouera un rle plus quimportant de ressources de base pour apprendre ces termes nouveaux. Les diffrentes analyses des corrlations qui ont t faites montrent un lien persistant entre la note de lecture donne par lenseignant et sa note dapprciation gnrale. Si les corrlations entre notre score de connaissance scolaire des mots courants et les notes dapprciation et de lecture de lenseignant sont importantes, elles tendent diminuer quand le niveau scolaire tudi augmente. On peut penser que les exigences que recoupent ces notes voluent et ne qualifient plus seulement la connaissance du vocabulaire lies aux activits de lecture qui serait privilgie dans les premires annes.
213
4. D ISCUSSION
Au niveau des rsultats, le score Russites moins Erreurs (Bonnes rponses moins erreurs) est ds le primaire un bon prdicteur de lapprciation gnrale des lves. Pourtant, les pratiques au primaire (absence de notes pour valuer les lves) font que cette apprciation gnrale est un indicateur assez subjectif dans nos tudes, car elle ne se fonde pas comme au collge sur la moyenne gnrale des matires. La corrlation importante et continue sur les cinq annes tudies entre notes de lecture et apprciation gnrale nous suggre que cette dernire renvoie aux objectifs institutionnels de la matrise de la lecture. Mais, au Cours Moyen, il semble que cette apprciation gnrale stoffe dautres critres pour dterminer les qualits dun lve du primaire. Dans ce chapitre, les deux mthodes dinvestigation par questionnaires choix multiples que nous avons employes permettent de rpondre deux questions diffrentes. Lune observe de manire gnrale le dveloppement annuel des mots du vocabulaire courant au primaire (mthode sur la totalit des mots du primaire), lautre rinitialise chaque anne le compteur du vocabulaire apprendre pour voir la position atteinte la fin de lanne tudie (QCM par niveaux). Pour ltude du vocabulaire courant, la mthode qui examine la progression de lacquisition des mots lobjectif du primaire nous parat plus adapte que lautre. Si les QCM par niveaux sont intressants pour ltude annuelle des mots techniques par discipline au collge, leur emploi au primaire est moins informatif, par exemple, sur les connaissances pralables des lves au CP. Nanmoins, les deux mthodes de QCM sont complmentaires. Avec 41 % de rponses correctes en moyenne, nous avons estim que ces jeunes lves connaissaient en fin du Cours Prparatoire prs de 4 500 mots courants scolaires (QCM sur la totalit du primaire). Lexamen par niveau nous renseigne que ces jeunes enfants
214
auraient appris environ 1 000 mots des manuels scolaires. En demeurant prudent, on pourrait estimer que ces enfants connaissaient avant le Cours Prparatoire prs de 3 500 mots. Alors que nous pensions dtecter des erreurs formelles plus nombreuses chez les jeunes lves que les erreurs de type smantique, nos deux tudes nont pu confirmer cette hypothse. Peut-tre la sur-reprsentation des QCM possdant deux piges smantiques a-telle parasit nos rsultats. Nanmoins, les corrlations entre erreurs formelles et smantiques ont toujours t importantes, laissant penser que ces deux erreurs ne sont pas trs distantes. Enfin, comme Nagy & Anderson (1984), nous pensons que lutilisation des manuels scolaires en usage est judicieuse pour mesurer ltendue des rpertoires lexicaux des lves. Le fait que les diffrences entre tablissements soient restes marginales dans notre tude n4 nous suggre que nos QCM sont utilisables dans des coles ayant dautres ouvrages de rfrence. Les inventaires du vocabulaire issus dchantillons de livres scolaires sont donc une alternative aux dictionnaires.
215
CONCLUSION
Conclusion
216
Nous dtruisons chaque jour des mots, des vingtaines de mots, des centaines de mots. Nous taillons dans le langage jusqu los []. Ne voyez-vous pas que le vritable but du novlangue est de restreindre les limites de la pense ? [] Chaque anne de moins en moins de mot, et le champ de la conscience de plus en plus restreint. Syme, partisan de Big Brother Georges Orwell (1950, trad.), 1984, Gallimard
Cette citation, tire dune uvre de fiction, indique bien qu e le vocabulaire, dans sa richesse et son tendue, est un facteur plus que prgnant de nos activits cognitives en gnral. Un lve disposant dun lexique de peu de mots techniques ds la Sixime voit en effet ses chances de succs rduites au Brevet des collges. La mmoire encyclopdique scolaire est donc trs importante pour prdire le devenir scolaire, plus encore que les capacits intellectuelles des lves ne lindiquent. Dans ce travail, nous avons montr quil est difficile aux chercheurs de sentendre non seulement sur la dfinition des connaissances mais aussi sur lorigine dextraction des mots et leurs valuations. Il nous faut ajouter que pour une mme dfinition dun mme ouvrage de rfrence les mthodes employes pour le recensement peuvent conduire des comptages fort diffrents. Le chapitre trois nous aura convaincu quun comptage manuel par rapport une liste de rfrence aboutit des biais dvaluation subjective qui conditionnent linclusion ou non dun mot dans un dictionnaire technique. Une mthode assiste par des outils informatiques est recommander, mme si elle contraint une dfinition plus stricte en terme de formes graphiques plutt que de mots. Le volume de travail est ainsi plus rapidement trait et moins critiquable mthodologiquement.
Conclusion
217
Bien sr, nos inventaires de vocabulaire nont ni la porte ni la quantit de ceux de Nagy & Anderson (1984) ou ceux dAnglin (1993). Ils rpondent un besoin mthodologique de clarifier la notion de vocabulaire courant chez Lieury (1991-1996) par opposition au vocabulaire technique du collge. Nous proposons quil soit utile dintroduire le degr de difficult des mots dans ce dcoupage dichotomique du vocabulaire. Toutefois, nos inventaires reprsentent une estimation minimaliste du vocabulaire scolaire du CP au CM2 dans notre tude n2. Aussi, dclarer que cest l le vocabulaire savoir strictement au primaire serait rducteur car dautres aspects pdagogiques sont sans doute considrer. Cest pourquoi nous prfrons employer le terme de vocabulaire courant scolaire pour voquer les connaissances vues par les enfants scolariss. Dans ces diffrentes tudes, nous avons pu donner une premire tentative de corrections aux inventaires du collge franais. Ceux-ci voient lestimation en mots techniques multiplie par 2,5 par rapport ltude longitudinale de Lieury et coll. : les objectifs du collge ne seraient plus de 24 000 mots mais de 59 000 mots en fin de 3me. Ce ne sont pour linstant que des estimations, rappelons-le. Vraisemblablement, il sera utile de refaire des inventaires disciplinaires qui actualisent les manuels scolaires du collge. En effet, nous ne pouvons pas nous contenter de la seule rvaluation par le calcul du vocabulaire technique comme indiqu au chapitre trois. Ces travaux devront rendre possibles, comme au primaire, la cration dun lexique synthtisant les mots du collge. Ceci fait, diverses tudes seront alors ralisables avec ces connaissances encyclopdiques scolaires du collge. Par exemple, on peut envisager une tude transversale par QCM de la Sixime la Troisime mesurant l'oubli et le maintien chez les lves des connaissances techniques apprises depuis le dbut de ce cycle par rapport au dveloppement du vocabulaire courant scolaire. Le problme des connaissances encyclopdiques scolaires est
Conclusion
218
plus complexe pour le lyce franais. Les filires de formation tant plus spcialises encore au niveau des matires enseignes, le volume de travail serait prodigieusement norme.
219
RFRENCES BIBLIOGRAPHIQUES
Rfrences bibliographiques
220
Abbott, V., Black, J. B. & Smith, E. E. (1985). The representation of scripts in memory, Journal of Memory and Language, 24, 179-199. Anderson, J. R. & Bower, G. H. (1973). Human associative memory, Washington, DC : Winston. Anderson, J. R. & Reder, L. M. (1974). Negative judgments in and about semantic memory, Journal of Verbal Learning and Verbal Behavior, 13, 664-681. Anderson, R. C., Wilson, P. T. & Fielding, L. G. (1988). Growth in reading and how children spend their time outside of school, Reading Research Quarterly, 23, 3, 285-303. Anderson, R.C., & Freebody, P. (1981). Vocabulary knowledge. In Guthrie, J. (Ed.), Comprehension and Teaching (pp. 77-117), Newark, DE : International Reading Association. Anglin, J. M. (1978). From reference to meaning, Child Development, 49, 969-976. Anglin, J. M. (1993). Vocabulary development : a morphological analysis. Avec commentaire de G. A. Miller & P. C. Wakefield, et reprise de J. M. Anglin, Monographs of the Society for Research in Child Development, 58, 10, No. 238. Aronoff, M. (1976). Word formation in generative grammar, Cambridge, MA : MIT Press. Atkinson, R. C. & Shiffrin, R. M. (1968). Human memory : a proposed system and its control process, in K. W. Spence & J. T. Spence (Eds.), The Psychology of learning and motivation : advances in research and theory (pp 89-195), Vol. 2., London : Academic Press.
221
Atkinson, R. C. (1975). Mnemotechnics in second-learning language, American Psychologist, 30, 821-828. Aubret, F. (1987). Pronostic de la scolarit en second cycle secondaire : validit prdictive de certains tests collectifs et dapprciations scolaires en classe de 3me, Lorientation scolaire et professionnelle, 16, 2, 151-158. Baddeley, A. D. & Hitch, G. (1974). Working memory, in G A Bower (Ed) Recent advances in learning and motivation (pp 47-90), Vol. 8, New York : Academic Press. Baddeley, A. D. (1986). Working memory, Oxford : Oxford University Press. Baddeley, A. D. (1992). Working memory, Science, 255, 556-559. Bahrick, H. P. (1971). Accessibility and availability of retrieval cues in the retention of categorized list, Journal of Experimental Psychology, 89, 117-125. Baldinger, K. (1984). Vers une smantique moderne, Paris : Klincksieck. Barnett, V. (1974). Elements of sampling theory, London : Edward Arnold. Barth, B. M. (1987). Lapprentissage de labstraction, Paris : Retz. Basden, D. R. & Draper, J. S. (1973). Effect of cueing with list members in free recall as a function of number of categories, taxonomic, frequency and presentation order, Canadian Journal of Psychology, 27, 327-333. Bauer, L; (1983). English word-formation, NewYork : Cambridge University Press. Beck, I., McCaslin, E. & McKeown, M.G. (1980). The rationale and design of a program to teach vocabulary to fourth-grade students, University of Pittsburgh, Learning Reseach and Development Center : Pittsburgh. Beck, I., Perfetti, C. & McKeown, M. (1982). The effects of long-term vocabulary instruction on lexical access and reading comprehension, Journal of Educational Psychology, 74, 4, 506-521.
222
Becker, W., Dixon, R. & Anderson-Inman, L. (1980). Morphographic and root word analysis of 26,000 high frequency words (Tech. Rep. 1980-1), University of Oregon Follow through project : Eugene, OR. Benzcri, J.-P. (1979). Lanalyse des donnes : tome 1, la taxonomie, Paris : Dunod. Benzcri, J.-P. (1981). Pratique de lanalyse des donnes : linguistique et lexicologie, Paris : Dunod. Binois, R. & Pichot, P. (1958). Test de vocabulaire, manuel, Les ditions du centre de Psychologie applique. Bloomfield, L. (1933). Language, New York : Henry Holt. Broadbent, D. E. (1958). Perception and communication, New York : Pergamon. Brown, R. (1973). A first language, Cambridge, MA : Harvard University Press. Brunet, E. (1981). Le vocabulaire franais de 1789 nos jours, daprs les donnes du Trsor de la langue franaise, Genve, Paris : Slatkine-Champion. Carey, S. & Bartlett, E. J. (1978). Acquiring a single new word, Papers and Reports on Child Language, 15, 17-29. Carey, S. (1978). The child as word learner, in M. Halle, J. Bresnan & G. A. Miller (Eds). Linguistic theory and psychological reality, (pp 264-293), Cambridge, MA : The MIT Press. Carnap, R. (1936). Studies in semantics. Vol 1 : Introduction to semantics, Cambridge : Cambridge University Press. Caron, J. (1989). Prcis de psycholinguistique, Paris : PUF. Carroll, J. B., Davies, P. & Richman, B. (1971). The american heritage word frequency book, Boston : Mifflin. Chang, T. M. (1986). Semantic memory : facts and models, Psychological Bulletin, 99, 199-220.
223
Charles, A. & Tardieu, H. (1977). Tables de frquence des lments de 28 catgories, Paris : Universit Ren Descartes. Charles, A. (1997). Le contrle de la mmoire : approche thorique et exprimentale, Habilitation diriger des recherches, Universit Victor Segalen Bordeaux 2. Chase, W. G. & Ericsson, K. A. (1981). Skilled memory, in John R. Anderson (Ed), Cognitive skills and their acquisition (pp 141-189), Hillsdale, New Jersey : Lawrence Erlbaum Associates. Chase, W. G. & Simon, H. A. (1973). Perception in chess, Cognitive Psychology, 4, 55-81. Cohen, M. (1950). Sur la statistique linguistique, Confrence de linstitut de linguistique de luniversit de Paris, Vol. 9, Anne 1949, Paris : Klincksieck. Collins, A. M. & Loftus, E. F. (1975). A spreading-activation theory of semantic processing, Psychological Review, 82, 407-428. Collins, A. M. & Quillian, M. R. (1969). Retrieval time from semantic memory, Journal of Verbal Learning and Verbal Behavior, 8, 240-247. Collins, A. M. & Quillian, M. R. (1970). Does category size affect categorization time ?, Journal of Verbal Learning and Verbal Behavior, 9, 432-438. Colvin, C. M. (1951). A re-examination of the vocabulary question, Elementary English, 28, 350-356. Conrad, C. (1972). Cognitive economy in semantic memory, Journal of Experimental Psychology, 92, 2, 149-154. Content, A., Mousty, P., & Radeau, M. (1990). Brulex : une base de donnes lexicales informatise pour le Franais crit et parl, L'Anne Psychologique, 90, 551-566. Conway, F. (1967). Sampling : an introduction for social sciences, London : Allen & Unwin. Corson, Y, & Blanchard, C. (1993). Contextes et variations trans-situationnelles des concepts, Journal international de Psychologie, 28, 4, 417-441.
224
Cowan, N. (1988). Evolving conception of memory storage, selective attention and their mutual constraints within the human information-processing system,
Psychological Bulletin, 104, 163-191. Craik, F. I. M. (1970). The fate of primary memory items in free recall, Journal of Verbal Learning and Verbal Behavior, 9, 143-147. Craik, F. I. M. (1976). La profondeur de traitement comme prdicteur des performances de la mmoire, Bulletin de Psychologie, No. Spcial, 133-142. Cunningham, A. E. & Stanovich, K. E. (1991). Tracking the unique effects of print exposure in children : assocations with vocabulary, general knowledge and spelling, Journal of Educational Knowledge, 83, 2, 264-274. Curtis, M. E. (1987). Vocabulary testing and vocabulary instruction, in M. G. McKeown & M. E. Curtis, The nature of vocabulary acquisition (pp 37-51), Lawrence Erlbaum Associates : Hilldale, New Jersey. Dale, E. (1956). The problem of vocabulary in reading, Educational Research Bulletin, 25, 113-123. Dro, M. (1994). Mmoire encyclopdique et acquisitions scolaires : autour dune leon dhistoire, note de recherche, Rennes : Laboratoire de Psychologie exprimentale, Universit Rennes 2. Dro, M. (1996). Lexique des connaissances scolaires, Actes de la journe du RIPSYDEV, Nantes, 22-30. Diderot, D. & Le Rond dAlembert, J. (dir.) (1751-1772). Encyclopdie, ou Dictionnaire raisonn des sciences, des arts et des mtiers , 17 vol. de texte et 11 vol. de planches, Paris (rd. fac sim., 35 vol., Stuttgart, 1966-1967). Dottrens, R. & Massarenti, D. (1963). Vocabulaire fondamental du franais : contribution un enseignement rationnel de lorthographe dusage, 3me dition, Neuchtel : Eds Delachaux & Niestl.
225
Dottrens, R. (1946). La pdagogie exprimentale et lenseignement de la langue maternelle, Neuchtel : Eds Delachaux & Niestl. Dubois, J. & Dubois, C. (1971). Introduction la lexicographie : les dictionnaires, Paris : Larousse. Dubois, J. (dir.) (1971). Dictionnaire du franais contemporain, Paris : Larousse. Ducharme, R. & Fraisse, P. (1965). Etude gntique de la mmorisation de mots et dimages, Canadian journal of Psychology, 19, 253-261. Dupuy, H. P. (1974). The rationale, development and standardization of a basic word vocabulary test, Washington, DC : U.S. Government Printing Office (DHEW Publication No. HRA 74-1334). Earhard, M. (1967). Cued recall and free recall as a function of the number of items per cue, Journal of Verbal Learning and Verbal Behavior, 6, 257-263. Ehri, L. (1984). How orthography alters spoken language competencies in children learning to read and spell, in J. Downing & R. Valtin (Eds), Language awareness and learning to read (pp 119-147), New York : Springer-Verlag. Ehrlich, S. (1965). Le rle de la structuration dans lapprentissage verbal, Psychologie franaise, 10, 119-146. Ehrlich, S. (1972). La capacit dapprhension verbale, Paris : PUF. Ehrlich, S., Bramaud du Boucheron, G. & Florin, A. (1978). Le dveloppement des connaissances lexicales lcole primaire, Poitiers, PUF. Eller, R. G., Pappas, C. C. & Brown, E. (1988). The lexical development of kindergarteners : learning from written context, Journal of Reading Behavior, 20, 1, 5-23. Elley, W. B. (1989). Vocabulary acquisition from listening to stories, Reading Research Quarterly, 24, 2, 174-187.
226
Ericsson, K. A. & Polson, P. G. (1988). A cognitive analysis of exceptional memory for restaurant orders, in Michelene T. H. Chi, Robert Glaser, M. J. Farr (Eds), The nature of expertise (pp 23-70), Hillsdale, New Jersey : Lawrence Erlbaum Associates. Ericsson, K. A. (1985). Memory skill, Canadian Journal of Psychology, 39, 2, 188-231. Estoup, J. B. (1916). Gammes stnographiques, 4me dition, Paris. Etessamipour, A. (1995). La mmoire des connaissances scolaires sur les lves lcole primaire en Iran, Thse de doctorat de Psychologie, Rennes : Universit de Haute Bretagne Rennes 2. Fenouillet, F. (1996). Mmoire et motivation : impact du but et de lgo sur lorganisation de linformation en mmoire, Thse de doctorat de Psychologie, Rennes : Universit de Haute Bretagne Rennes 2. Flieller, A., Delesmont, P. & Thibaut, E. (1992). La mesure des comptences lexicales : effets des instruments utiliss, Lanne psychologique, 92, 365-392. Florin, A. (1991). Pratiques du langage lcole maternelle et prdiction de la russite scolaire, Paris : PUF. Florin, A. (1993). Les connaissance lexicales des enfants dcole primaire, Pour une didactique des activits lexicales lcole, Repres : recherches en didactique du franais langue maternelle, 8, 93-112. Fradin, B. (1995). Lexicologie, in Encyclopdia Universalis, France : Encyclopdia Universalis France S.A. Freedman, J. L. & Loftus, E. F. (1971). Retrieval of words from long-term memory, Journal of Verbal Learning and Verbal Behavior, 10, 107-115. Frre Gonzalo Carlos (1938). Dtermination exprimentale du vocabulaire crit pour servir lenregistrement de lorthographe lcole primaire, Universit de Louvain. Funk and Wagnalls new standard dictionary of the English language (1937). Funk and Wagnalls Co, 2 Vol. unabridged edition : New York.
227
Garten, J. A. & Blick, K. A. (1974). Retention of word-pairs for experimenter supplied and subject originated mnemonics, Psychological Reports, 35, 1099-1104. Geiselman, R. E, Woodward, A. E. & Beatty, J. (1982). Individual differences in verbal memory performance : A test of alternative information-processing models, Journal of Experimental Psychology : General, 111, 109-134. Geoffroy, A., Lafon, P. & Tournier, M. (1974). Lindexation minimale, plaidoyer pour une non-lemmatisation, Colloque sur lanalyse des corpus linguistiques, Problmes et mthodes de lindexation minimale, Strasbourg 21-23 mai 1973. Glanzer, M., & Cunitz, A. R. (1966). Two storage mechanisms in free recall, Journal of Verbal Learning and Verbal Behavior, 5, 351-360. Gougenheim, G. (1954). Pour le franais lmentaire : rsultats dune enqute, Vie et langage, No. de fvrier 1954, 87-89. Gougenheim, G., Micha, R. Rivenc, P. & Sauvageot, A. (1959). Llaboration du franais fondamental (1er degr). Etude sur ltablissement dun vocabulaire de base et dune grammaire de base, Paris : Didier. Graves, M. (1986). Vocabulary learning and instruction, Review of Research in Education, 13, 49-89. Greaney, V. (1980). Factors related to amount and type of leisure time reading, Reading Research Quarterly, 15, 337-357. Gross, M. & Lentin, A. (1964). Notions sur les grammaires formelles, Paris. Guguen, N. (1995). Statcalc v.4.0, Rennes : LAUREPS, Universit de Haute Bretagne Rennes2. Guguen, N. (1997). Manuel de statistique pour psychologues, Paris : Dunod. Guiraud, P. (1954). Les caractres statistiques du vocabulaire, Paris : PUF. Guiraud, P. (1973). Initiation aux mthodes de la statistique linguistique, Paris : Hachette. Guiraud, P. (1977). Principes et mthodes de statistique lexicale, Paris : Hachette.
228
Hartman, G. W. (1941). A critique of the common method of estimating vocabulary size, together with some data on the absolute word knowledge of educated adults, Journal of Educational Psychology, 32, 351-358. Haygood, J. B. (1936). Le vocabulaire fondamental du franais, Paris : E. Droz. Henmon, V. A. C. (1924). A french word book based on a count of 400 000 running words, Madison : Bureau of Educational Research of Wisconsin. Herdan, G. (1964). Quantitative linguistics, Londres : Butterworths. Hollan, J. D. (1975). Features and semantic memory : set-theoretic or network model ?, Psychological review, 82, 154-155. Howes, D.H. & Solomon, R. L. (1951). Visual duration threshhold as a function of a word probability, Journal of Experimental Psychology, 41, 400-410. Hulme, C., Roodenrys, S., Brown, G. & Mercer, R. (1995). The role of long-term memory mechanisms in memory span, British Journal of Psychology, 86, 527-536. Hunt, E. J. (1978). Mechanics of verbal abiliy, Psychological Review, 85, 109-130. Huteau, M. (1995). Manuel de psychologie diffrentielle, Paris : Dunod. Huttenlocher, J., Haight, W., Bryck, A., Selter, M. & Lyons, T. (1991). Early vocabulary growth : relation to language input and gender, Developmental Psychology, 27, 236-248. Imbs, P. (1971). Etudes statistiques sur le vocabulaire franais. dictionnaire des frquences. Vocabulaire littraire des XIXe et XXe sicles, Centre de recherche pour un Trsor de la Langue Franaise (CNRS), Nancy, Paris : Didier. Jamet, E. (1997). Lecture et russite scolaire, Paris : Dunod. Jenkins, J. & Dixon, R. (1983). Vocabulary learning, Contemporary Educational Psychology, 8, 237-260. Jenkins, J. R., Stein, M. L. & Wysocki, K. (1984). Learning vocabulary through reading, American Educational Research Journal, 21, 4, 767-787.
229
Jensen, A. R. (1980). Bias in mental testing, New York : Free Press. Juilland, A., Brodin, D. & Donovitch, C. (1970). Frequency dictionary of french words, Paris : Mouton La Haye. Just, M. A. & Carpenter, P. A. (1987). Vocabulary acquisition, in Just, M. A. & Carpenter, P. A., The Psychology of reading and language comprehension, (pp 103-128), Allayn and Bacon Inc. Karli, P. (1969). Le systme limbique, in C. Kayser, Trait de physiologie (pp 1081-1122), Tome 2, Paris : Masson. Kirkpatrick, E. A. (1891). The number of words in an ordinary vocabulary, Science, 18, 107-108. Lakoff, G. (1972). Hedges : a study in meaning criteria and the logic of fuzzy concepts, Papers from the height regional meeting of the Chicago Linguistic Society, Chicago : University of Chicago Linguistic Department. Landauer, T. K. & Meyer, D. E. (1972). Category size and semantic-memory retrieval, Journal of Verbal Learning and Verbal Behavior, 11, 539-549. Larousse, P. (1865). Grand dictionnaire universel du XIXe sicle, (15 volumes), Paris : Librairie Larousse et Boyer. Le Ny, J.-F. (1976). Smes ou mmes ?, Bulletin de Psychologie, No. Spcial, 46-54. Lebart, L. & Salem, A. (1988). Analyses statistiques des donnes textuelles, Paris : Dunod. Lebart, L. & Salem, A. (1994). Statistique textuelle, Paris : Dunod. Lebart, L., Morineau, A. & Bcue, M. (1989). SPADT, Systme Portable pour lAnalyse des Donnes Textuelles, Manuel de rfrence, Paris : CISIA. Lieury, A. & Fenouillet, F. (1996). Motivation et russite scolaire, Paris : Dunod. Lieury, A. & Forest, D. (1994). La mmoire et le concept : les pisodes de la connaissance, Le langage et lhomme, 24, 2, 125-145.
230
Lieury, A. (1976). Les indices de rcupration phontiques oprent-ils comme les indices smantiques ?, Bulletin de psychologie, No. Spcial, 174-179. Lieury, A. (1979). La mmoire pisodique est-elle embote dans la mmoire smantique ?, L'Anne Psychologique, 79, 123-142. Lieury, A. (1991). Et si le meilleur prdicteur de la russite scolaire tait la biologie !, Cahiers de Beaulieu (Rennes 1), 13, 38-51. Lieury, A. (1992a). La mmoire : rsultats et thories, Lige : Mardaga. Lieury, A. (1992b). Des mthodes pour la mmoire : mais pas nimporte lesquelles, Paris : Dunod. Lieury, A. (1993a). La mmoire : du cerveau lcole, Paris : Flammarion. Lieury, A. (1993b). 2me dition. Mmoire et russite scolaire, Paris : Dunod. Lieury, A. (1996). Mmoire encyclopdique et devenir scolaire : tude longitudinale dune cohorte sur les quatre annes du collge franais, Psychologie et psychomtrie, 17, 3, 33-44. Lieury, A. (1997). 2me dition. Manuel de Psychologie gnrale, Dunod. Lieury, A., Van Acker, P. & Durand, P. (1995a). Mmoire encyclopdique et russite en Quatrime de collge, Psychologie et psychomtrie, 16, 1, 25-48. Lieury, A., Van Acker, P. & Durand, P. (1995b). Mmoire encyclopdique et russite en 3me et au brevet des collges, Psychologie et psychomtrie, 16, 3, 35-59. Lieury, A., Van Acker, P., Clvd, M., Durand, P. (1992a). Les facteurs de la russite scolaire : raisonnement ou mmoire smantique ?, 2me anne dune tude longitudinale en cycle secondaire (5me), Psychologie et psychomtrie, 13, 1, 33-46. Lieury, A., Van Acker, P., Clvd, M., Durand, P. (1992b). Mmoire des connaissances et russite en cinquime, Le Langage et l'Homme, 27, 1, 61-76.
231
Lorge, I. & Chall, J. (1963). Estimating the size of vocabularies of children and adults : an analysis of methodological issues, The Journal of Experimental Education, 32, 147-157. Maccoby, E. & Jacklin, C. (1974). The Psychology of sex differences, Standford, CA : Standford University Press. Makkai, A. (1972). Idiom structure in English, The Hague : Mouton. Mandelbrot, B. (1961). On the theory of words frequency and on related Markovian models of discourses, Structure of language and its mathematical aspects, American mathematical society, Providence, R.I., 190-219. Mandler, G., Pearlstone, Z. & Koopmans, H. S. (1969). Effects of organization and semantic similarity on recall and recognition, Journal of Verbal Learning and Verbal Behavior, 8, 410-423. Mator, G. (1967). Histoire des dictionnaires franais, Paris : Larousse. McKeown, M. G., Beck, I., Omanson, R. & Perfetti, C. (1983). The effects of long-term vocabulary instruction on reading comprehension : a replication, Journal of Reading Behavior, 15, 1, 3-18. Meyer, D. E. & Schvaneveldt, R. W. (1971). Facilitation in recognizing paris of words : evidence of a dependance between retrieval operations, Journal of Experimental Psychology, 90, 227-234. Meyer, D. E. (1970). On the representation and retrieval of stored semantic information, Cognitive Psychology, 1, 242-300. Meyer, D. E. (1973). Verifying affirmative and negative propositions : effects of negation on memory retrieval, in S. Kornblum (Ed), Attention and performance nIV, New York : Academic press. Meyer, D. E. (1975). Long-term memory retrieval during the comprehension of affirmative and negative sentences, in R. A. Kennedy & A. L. Wilkes (Eds), Studies in longterm memory, London : Wiley.
232
Meyer, D. E. (1976). Mmoire smantique, comprhension de phrases et temps de raction, Bulletin de psychologie, No. Spcial, 102-115. Miller, G. A. & Gildea, P. N. (1987). How school children learn words, Scientific American, 257, 94-98. Miller, G. A. (1977). Spontaneous apprentices : children and language, New York : Seabury. Miller, G. A. (1978a). The acquisition of word meaning, Child Development, 49, 999-1004. Miller, G. A. (1978b). Semantic relations among words, in M. Halle, J. Bresnan & G. A. Miller (Eds). Linguistic theory and psychological reality, (pp 60-118), Cambridge, MA : The MIT Press. Miller, G. A. (1988). The challenge of universal literacy, Science, 241, 1293-1299. Miller, G. A. (1991). The science of words, New York : Scientific American Library. Milner, B. (1970). Pathologie de la mmoire, in La mmoire, symposium, Paris : PUF. Ministre de lducation nationale. (1991). Les cycles lcole primaire, Paris : CNDP / Hachettes coles (collection une cole pour lenfant, des outils pour les matres). Ministre de lducation nationale. (1995). Programmes de lcole primaire, Paris : CNDP (collection une cole pour lenfant, des outils pour les matres). Moreau, M.-L. & Richelle, M. (1984). 2me dition. Lacquisition du langage, Lige : Mardaga. Morton, J. (1982). Desintegrating the lexicon, in J. Mehler, E. G. T. Walker & M. Garrett (Eds), Perpectives in mental representation (pp 89-109), Hillsdale, New Jersey : Lawrence Erlbaum Associates. Muller, C. (1964). Essai de statistique lexicale : lillusion comique de P. Corneille, Paris : Klincksieck. Muller, C. (1968). Initiation la statistique linguistique, Paris : Larousse.
233
Muller, C. (1977). Principes et mthodes de la statisique lexicale, Paris : Hachette. Murdock, B. B. (1962). The serial position effect of free recall, Journal of Experimental Psychology, 64, 482-488. NGuyen Xuan, A. (1969). Etude par le modle factoriel dune hypothse sur les processus de dveloppement : recherche sur quelques aptitudes intellectuelles chez des lves du premier cycle de lenseignement secondaire, Thse de doctorat, Paris : Laboratoire de Psychologie diffrentielle. Nagy, W. E. & Anderson, R. C. (1984). How many words are there in printed school English, Reading Research Quarterly, 19, 3, 304-330. Nagy, W. E., Anderson, R. C., & Herman, P. A. (1987). Learning word meanings from context during normal reading, American Educational Research Journal, 24, 237-270. Nagy, W. E., Anderson, R. C., & Herman, P. A. (1987). Learning word meanings from context during normal reading, American Educational Research Journal, 24, 237-270. Nagy, W. E. & Herman, P. A. (1987). Breadth and depth of vocabulary knowledge : implications for acquisition and instruction, in M. G. McKeown & M. E. Curtis, The nature of vocabulary acquisition (pp 19-35), Hillsdale, New Jersey : Lawrence Erlbaum Associates. Ogden, C. K. (1944). Basic English : a general introduction with rules and grammar, 9me dition, Londres. Paivio, A. (1969). Mental imagery in associative learning and memory, Psychological Review, 76, 241-236. Postal, V. & Lieury, A. (1997). Organisation de la mmoire encyclopdique : tendue et spcificit, implication dans la russite scolaire, Revue europenne de Psychologie applique, (sous presse).
234
Postal, V. (1997). Mmoire encyclopdique, expertise et vieillissement, Thse de doctorat de Psychologie, Rennes : Universit de Haute Bretagne Rennes 2. Postal, V., Dro, M. & Lieury, A. (1996). Temps de dcision pour les noms propres et les noms communs en mmoire encyclopdique, Le langage et lhomme, 31, No. 2-3, 137-173. Pottier, B. (1974). Linguistique gnrale, Paris : Klincksieck. Prescott, D. A. (1923). Le vocabulaire des enfants et des manuels de lecture, Genve : Librairie Kundig. Pressley, M., Levin, J. R. & McDaniel, M. (1987). Remembering versus inferring what a word means : mnemonic and contextual approaches, in M. G. McKeown & M. E. Curtis, The nature of vocabulary acquisition (pp 107-127), Hillsdale, New Jersey : Lawrence Erlbaum Associates. Putnam, H. (1975). The Meaning of meaning, in H. Putnam (dir.), Mind, Language and Reality, Philosophical Papers 2, Cambridge : Cambridge University Press. Quaireau, C. (1994). Lamorage en mmoire : de lactivation aux mcanismes attentionnels, Thse de doctorat de Psychologie, Rennes : Universit de Haute Bretagne Rennes 2. Quemada, B. (1968). Les Dictionnaires du franais moderne, Paris : Didier. Quemada, B. (1995). Dictionnaire, in Encyclopdia Universalis, France : Encyclopdia Universalis France S.A. Quid (1993). Encyclopdie mthodique, Paris : Robert Laffont. Quillian, M. R. (1968). Semantic memory, in M. Minsky (Ed), Semantic information processing, Cambridge, MA : MIT Press. Quillian, M. R. (1969). The teachable language comprehender : a simulation program and theory of language, Communications of the Association for Computing Machinery, 12, 459-476.
235
Reinert, M. (1983). Une mthode de classification descendante hirarchique : application lanalyse lexicale par contexte, Les cahiers de lanalyse des donnes, 8, 3, 187-198. Reinert, M. (1987). Un logiciel danalyse des donnes textuelles : ALCESTE, INRIA. Reinert, M. (1990). Alceste - Une mthodologie danalyse des donnes textuelles et une application : AURLIA de G. Nerval, Bulletin de mthodologie sociologique, 26, 24-54. Rey, A. (1977). Le Lexique, images et modles : du dictionnaire la lexicologie, Paris : Armand Colin. Rips, L. J., Shoben, E. J. & Smith, E. E. (1973). Semantic distance and the verification of semantic relations, Journal of Verbal Learning and Verbal Behavior, 12, 1-20. Robbins, C. & Ehri, L. C. (1994). Reading storybooks to kindergartners helps them to learn new vocabulary words, Journal of Educational Psychology, 86, 1, 54-64. Robert, M. (1995). Fonctionnement cognitif et comparaisons inter-sexes, in J. Lautrey (Ed.), Luniversel et le diffrentiel en psychologie, Paris : PUF. Roenker, D. L., Thompson, C. P. & Brown, S. C. (1971). Comparison of measures for estimation of clustering in free recall, Psychological bulletin, 76, 45-48. Rosch, E. & Mervis, C. B. (1975). Family resemblances : studies in the internal structure of categories, Cognitive Psychology, 7, 573-605. Rosch, E. (1973). Natural categories, Cognitive Psychology, 4, 328-350. Rosch, E. (1977). Human categorization, in N. Warren (Ed.) Advances in cross-cultural Psychology, (pp. 1-49), Vol. 1, London : Academic press. Rosch, E., Mervis, C. B., Gray, W. D., Johnson, D. M. & Boyes-Braem, P. (1976). Basic objects in natural categories, Cognitive Psychology, 8, 382-439. Rossi, J.-P. & coll. (1989). La mthode exprimentale en Psychologie, Paris : Dunod.
236
Rumelhart, D. E., McClelland, J. L. & the PDP research group. (1986). Parallel distribued processing : explorations in the microstructure of cognition, Vol. 1 & 2, MIT Press. Rundus, D. (1971). An analysis of rehearsal processes in free recall, Journal of Experimental Psychology, 89, 63-77. Rundus, D. (1977). Maintenance rehearsal and single-level processing, Journal of Verbal Learning and Verbal Behavior, 16, 665-681. Salthouse, T. A. (1991). Expertise as the circumventium of human processing limitation, in K. A. Ericsson & J. Smith (Eds.), Toward a general theory of expertise : prospects and limits, Cambridge : Cambridge University Press. Schaeffer, B. & Wallace, R. (1969). Semantic similarity and the comparison of word meanings, Journal of Experimental Psychology, 82, 343-346. Schaeffer, B. & Wallace, R. (1970). The comparison of word meanings, Journal of Experimental Psychology, 86, 2, 144-152. Schank, R. C. & Abelson, R. P. (1977). Scripts : plans, goals and unterstanding, Hillsdale, NJ : Erlbaum. Schank, R. C. (1976). Existe-t-il une mmoire smantique ?, Bulletin de Psychologie, No. Spcial, 26-33. Schulman, J. & Havighurst, R. (1947). Relationship between ability and social status in a midwestern comunity : size of vocabulary, Journal of Educational Psychology, 38, 437-442. Seashore, R. H., & Eckerson, L. D. (1940). The measurement of individual differences in general English vocabularies. The Journal of Educational Psychology, 31, 14-37. Snchal, M. (1997). The differential effect of storybook reading on preschoolers acquisition of expressive and receptive vocabulary, Journal of Child Language, 24, 123-138. Snchal, M., & Cornell, E. H. (1993). Vocabulary acquisition through shared reading experiences, Reading Research Quarterly, 28, 360-374.
237
Snchal, M., Thomas, E. & Moker, J.-A. (1995). Individual differences in four four-yearold childrens acquisition of vocabulary during storybook reading, Journal of Educational Psychology, 87, 2, 218-229. Shannon, C. E. & Weaver, W. (1963). The mathematical theory of communication, Urbana : Illinois University Press. Shibles, B. H. (1959). How many words does a first grade child know?, Elementary English, 31, 42-47. Simon, H. A. & Chase, W. G. (1973). Skill in chess, American Scientist, 61, 394-403. Smith, E. E., Shoben, E. J. & Rips, L. J. (1974). Structure and process in semantic memory : a featural model for semantic decisions, Psychological Review, 81, 214-241. Smith, M. K. (1941). Measurement of the size of general English vocabulary through the elementary grades and high school, Genetic Psychology Monographs, 24, 311-345. Stanovich, K. E. (1986). Matthew effects in reading : some consequences of individual differences in the acquisition of literacy, Reading Research Quarterly, 21, 360-406. Stanovich, K. E., Cunningham, A. E. & Feeman, D. J. (1984a). Intelligence, cognitive skills and early reading progress, Reading Research Quarterly, 19, 3, 278-303. Stanovich, K. E., Cunningham, A. E. & Feeman, D. J. (1984b). Relation between early reading acquisition and word decoding with and without context : a longitudinal study of first-grade children, Journal of Educational Psychology, 76, 4, 668-677. Stanovich, K. E., West, R. F. & Harrison, M. R. (1995). Knowledge growth and maintenance across the life span : the role of print exposure, Development Psychology, 31, 5, 811-826. Sternberg, R. J. & Powell, J. S. (1983). Comprehending verbal comprehension, American Psychologist, 38, 878-893.
238
Sternberg, R. J. (1987). Most vocabulary is learned from context, in M. G. McKeown & M. E. Curtis, The nature of vocabulary acquisition (pp 89-106), Hillsdale, New Jersey : Lawrence Erlbaum Associates. Templin, M. C. (1957). Certain language skills in children, their development and interrelationships, Mineapolis : University Minnesota Press. Terman, L. M. (1916). The measurement of intelligence, Boston : Mifflin. Ters, F. (1985). Les 1000 mots fondamentaux de lcole lmentaire : chelle Dubois-Buyse, vocabulaire actif, Editions MDI. Ters, F., Mayer, G. & Reichenbach, D. (1969). Vocabulaire orthographique de base, Neuchtel : Messeiller. Tiberghien, G. & Lecocq, P. (1983). Rappel et reconnaissance : encodage et recherche en mmoire, Lille : Presses Universitaires de Lilles. Tulving, E. & Thomson, D. M. (1971). Retrieval processes in recognition memory : effects of associative context, Journal of Experimental Psychology, 87, 116-124. Tulving, E. (1962). Subjective organization in free recall of unrelated words, Psychological review, 69, 344-354. Tulving, E. (1972). Episodic and semantic memory, in E. Tulving & W. Donaldson (Eds) Organization of memory (pp 382-403), New York : Academic Press. Tulving, E. (1985). How many systems are there ?, American Psychologist, 40, 4, 385-398. Vander Beke, G. E. (1935). French word book, New York : The MacMillan Company. Walberg, H. J. & Tsai, S. (1984). Reading achievement and disminishing returns to time, Journal of Educational Psychology, 76, 3, 442-451. Watson, J. B. (1924). Le Bhaviorisme, Paris : CPEL (1972 : traduction de ldition revue de 1958). Werner, H. & Kaplan, E. (1952). The acquisition of word meanings : a developmental study, Monographs of the society for research in child development, No. 51.
239
Wilkins, A. J. (1971). Conjoint frequency, category size and categorization time, Journal of Verbal Learning and Verbal Behavior, 10, 382-385. Williams, H. M. (1932). Some problems of sampling in vocabulary tests, Journal of Experimental Education, 1, 131-133. Wood, G. (1967). Category names as cues for the recall of category instances, Psychonomic Science, 9, 323-324. Wood, G. (1969). Retrieval cues and accessibility of higher-order memory units in multitrial free recall, Journal of Verbal Learning and Verbal Behavior, 8, 782-789. Yekovich, F. R. & Walker, C. H. (1986). Retrieval of scripted concepts, Journal of Memory and Language, 25, 627-644. Yule, G. U. (1944). The statistical study of literacy vocabulary, Cambridge : Cambridge University Press. Zipf, G. K. (1935). The psychobiology of language, an introduction to dynamic philology, Boston : Houghton-Mifflin. Trad. Franaise : La psychobiologie du langage, 1974, Paris : Retz-CEPL.
240
TABLES ET INDEX
Tables et Index
241
1. TABLE DES FIGURES
Figure 1 Figure 2 Figure 3 Figure 4 Figure 5 Figure 6 Figure 7 Figure 8 Figure 9 Figure 10 Figure 11 Figure 12
Exemple de reprsentation graphique dun diagramme de Pareto du produit f r de la relation de Zipf (1935) ....................................................................... 25 tapes de construction et de slection des mots du S.E. Test de Seashore et Eckerson (1940), adapt de Ehrlich & coll. (1978) ............................................ 38 Reprsentation graphique de relations entre des mots : exemple de la famille de add (daprs Nagy et Anderson, 1984) ......................................................... 42 Estimation du vocabulaire encyclopdique de la 6me la 3me en fin danne scolaire, daprs Lieury, Van Acker & Durand, 1995b ...................................... 52 valuation de la comprhension selon la rptition du mme mot dans des contextes pisodiques varis, simplifi daprs Jenkins et Dixon (1983) ........... 69 Reprsentation graphique de lestimation de la croissance journalire en mots selon leurs types morphologiques, daprs Anglin (1993) ................................. 73 Figure simplifie du modle de Broadbent (1958) ............................................. 91 Modle dAtkinson & Shiffrin (1968) - Les flches pleines indiquent le trajet de linformation - Les flches en pointill indiquent les signaux de commandes .... 93 Modle modulaire de la mmoire (Lieury, 1992a) ............................................. 94 Reprsentation simplifie du modle de mmoire de travail (Baddeley & Hitch, 1974) ................................................................................................................... 97 Exemple dorganisation hirarchique de la mmoire smantique, daprs Collins & Quillian (1969) ................................................................................. 110 Reprsentation de la relation smantique existant entre quelques concepts, d'aprs Collins et Loftus (1975) - une ligne courte exprime une relation plus forte ................................................................................................................... 112 Estimation du vocabulaire encyclopdique de la 6me la 3me en fin danne scolaire, daprs Lieury, Van Acker & Durand, 1995b. ................................... 122 Capacit rtrospective de la mmoire encyclopdique (mesure par le vocabulaire spcifique de la 6me) correspondant au devenir scolaire, Lieury (1996). ............................................................................................................... 125 Temps de rponse moyen selon la difficult subjective des mots ...................... 168 Reprsentation graphique des distributions des mots courants et des mots techniques selon lchelle subjective de difficult ............................................ 169
Figure 13 Figure 14
Figure 15 Figure 16
Tables et Index
242
Figure 17 Figure 18 Figure 19 Figure 20 Figure 21 Figure 22 Figure 23
Reprsentation graphique des distributions des mots techniques chez Lieury & coll. et Dro selon lchelle subjective de difficult ......................................... 170 Comparaison en pourcentages des mots techniques chez Lieury & coll. et Dro selon lchelle subjective de difficult .............................................................. 171 Comparaison en pourcentages des regroupements de la difficult des mots techniques des inventaires de Lieury & coll. et Dro ....................................... 172 Reprsentation graphique des pourcentages de diffrents scores au QCM par niveau ................................................................................................................ 196 Reprsentation graphique de lestimation du vocabulaire acquis au primaire par les QCM de niveau ............................................................................................ 197 Progression des lves dans la connaissance des 100 mots du primaire ......... 210 Estimation du dveloppement du vocabulaire courant au primaire et en 6me . 211
Tables et Index
243
2. TABLE DES TABLEAUX
Tableau 1 Tableau 2 Tableau 3 Tableau 4 Tableau 5 Tableau 6 Tableau 7 Tableau 8 Tableau 9
Quelques tudes de langue anglaise de vocabulaire basique dadultes (daprs Dottrens et Massarenti, 1963) ............................................................................ 30 Quelques tudes de langue anglaise de vocabulaire basique dlves (daprs Dottrens et Massarenti, 1963) ............................................................................ 31 Principales tudes de langue franaise de vocabulaire basique des lves ....... 35 Tableau rcapitulatif des estimations de Seashore et Eckerson, Smith et Templin sur la base du S.E. Test ....................................................................................... 40 Quelques tudes de langue anglaise sur les estimations de vocabulaire, daprs Cuff (1930), Seashore & Eckerson (1940) et complt ...................................... 46 Vocabulaire technique de la 6me et de la 5me (rpartitions par matires et pourcentage de mots communs) daprs Lieury & coll., 1992b ......................... 51 Estimation de la croissance journalire en mots selon leurs types morphologiques, daprs Anglin (1993) ............................................................. 73 Taux estims de croissance du vocabulaire en mots par jour (analyse de rsolution de problmes), daprs Anglin (1993) ............................................... 74 Rsultats scolaires moyens en fonction du sexe pour cinq disciplines de Seconde (Ministre de lducation nationale, 1985-1986)............................................... 76
Tableau 10 Inventaire du vocabulaire technique de la 6me et de la 3me (rpartitions par matire), daprs Lieury (1996) ........................................................................ 121 Tableau 11 Rsum de linventaire dtaill du manuel scolaire dhistoire en Sixime de collge et quelques indicateurs sur les entres lexicales .................................. 147 Tableau 12 Extrait du nouvel inventaire du manuel dhistoire de la Sixime, daprs Dro (1996). ............................................................................................................... 149 Tableau 13 Rsum des inventaires du Cours Prparatoire, du Cours lmentaire et du Cours Moyen au primaire et quelques indicateurs sur les entres lexicales (Dro, 1996) ...................................................................................................... 154 Tableau 14 Nombre de mots en communs et mots supplmentaires entre le Cours Prparatoire, le Cours lmentaire et le Cours Moyen pour un chantillon de 10 ouvrages du primaire ........................................................................................ 155 Tableau 15 valuation de la difficult subjective des mots du manuel dhistoire 6me selon la distinction vocabulaire courant / vocabulaire technique de notre inventaire .. 168 Tableau 16 Comparaison de la difficult subjective des mots techniques du manuel dhistoire 6me selon les deux inventaires .......................................................... 170
Tables et Index
244
Tableau 17 Restimation du vocabulaire technique du collge franais sur la base du vocabulaire dhistoire 6me (rpartitions par matire) ..................................... 175 Tableau 18 Corrlations entre plusieurs indicateurs aux QCM par niveau du CP ............ 186 Tableau 19 Corrlations entre plusieurs indicateurs aux QCM par niveau du CE1 .......... 188 Tableau 20 Corrlations entre plusieurs indicateurs aux QCM par niveau du CE2 .......... 191 Tableau 21 Corrlations entre plusieurs indicateurs aux QCM par niveau du CM1 ......... 193 Tableau 22 Corrlations entre plusieurs indicateurs aux QCM par niveau du CM2 ......... 194 Tableau 23 Rsums des rponses aux QCM par niveau pour les 5 annes du primaire ... 195 Tableau 24 Estimation du vocabulaire acquis au primaire par les QCM de niveau .......... 197 Tableau 25 Corrlations entre plusieurs indicateurs aux QCM sur le primaire pour le Cours Prparatoire ...................................................................................................... 201 Tableau 26 Corrlations entre plusieurs indicateurs aux QCM sur le primaire pour le Cours lmentaire 1re anne ...................................................................................... 203 Tableau 27 Corrlations entre plusieurs indicateurs aux QCM sur le primaire pour le Cours lmentaire 2me anne ..................................................................................... 204 Tableau 28 Corrlations entre plusieurs indicateurs aux QCM sur le primaire pour le Cours Moyen 1re anne ............................................................................................... 205 Tableau 29 Corrlations entre plusieurs indicateurs aux QCM sur le primaire pour le Cours Moyen 2me anne .............................................................................................. 207 Tableau 30 Corrlations entre plusieurs matires scolaires de la 6me et le QCM sur la totalit du primaire ........................................................................................... 208 Tableau 31 Estimation du vocabulaire courant des lves aux QCM du primaire ............. 211
Tables et Index
245
3. I NDEX DES AUTEURS ET DES NOTIONS
A Abbott ............................................................... 116 Abelson .............................................................. 116 Anderson . 15, 36, 41, 42, 43, 53, 57, 58, 62, 66, 70, 73, 78, 79, 80, 110, 120, 128, 142, 174, 214, 217 Anglin 38, 39, 44, 45, 46, 53, 55, 59, 62, 70, 71, 72, 73, 74, 76, 77, 209, 217, 243 Aronoff ................................................................ 70 Atkinson .............................................67, 92, 93, 95 Aubret ........................................ 118, 123, 124, 125 B Baddeley .........................................95, 96, 106, 133 Bahrick.............................................................. 106 Baldinger............................................................. 17 Barnett ................................................................ 55 Barth ................................................................... 68 Bartlett ................................................................ 61 Basden ............................................................... 106 Bauer ..............................................................31, 70 Beatty .................................................................. 93 Beck ............................................ 58, 65, 66, 75, 134 Becker ................................................................. 66 Bcue ................................................................... 26 Benzcri..........................................................23, 27 Binois ................................................................. 127 Black.................................................................. 116 Blanchard ........................................................... 91 Blick ...........................................................100, 101 Bloomfield ........................................................... 71 Bower ................................. 100, 102, 103, 110, 116 Boyes-Braem....................................................... 18 Bramaud du Boucheron .........................21, 47, 50 Broadbent ......................................................91, 92 Brown ................................... 63, 70, 72, 89, 97, 100 Brunet ................................................................. 23 Bryck ................................................................... 76 C Carey ..................................................36, 60, 61, 64 Carnap ................................................................ 17 Caron .....................................................26, 32, 143 Carpenter ............................................................ 79 Carroll ............................................................41, 79 Chall ................................. 38, 53, 54, 55, 56, 58, 59 Chang .........................................................116, 130 Charles ...............................................107, 128, 129 Chase ..........................................................131, 132 Clvd ................................................................ 49
Cohen ...................................................................22 Collins ........ 108, 109, 110, 111, 114, 115, 116, 130 Colvin ...................................................................38 Conrad ....................................................... 110, 130 Content ................................................................21 Conway ................................................................55 Cornell .................................................................63 Corson ..................................................................91 Cours lmentaire 1re anne ... 46, 48, 77, 152, 180, 187, 188, 189, 191, 195, 197, 202, 203, 211, 244 Cours lmentaire 2me anne .... 39, 46, 48, 65, 152, 180, 189, 191, 192, 193, 195, 197, 204, 206, 209, 211, 244 Cours Moyen 1re anne . 46, 48, 183, 193, 195, 197, 199, 204, 205, 206, 211, 244 Cours Moyen 2me anne .... 2, 39, 46, 48, 50, 58, 69, 77, 120, 150, 151, 157, 178, 179, 180, 183, 193, 194, 195, 196, 197, 199, 206, 207, 211, 217, 244 Cours Prparatoire 2, 38, 45, 46, 152, 153, 154, 155, 156, 157, 178, 179, 180, 183, 185, 186, 187, 188, 192, 195, 196, 197, 198, 199, 200, 201, 202, 209, 210, 211, 213, 217, 244 Cowan ..................................................................93 Craik .............................................................. 89, 93 Cuff ......................................................................15 Cunitz ...................................................................89 Cunningham .................................................. 78, 79 Curtis .................................................................134 D Dale ......................................................................58 Davies ...................................................................41 Delesmont ............................................................15 Dro ................................ 2, 126, 128, 136, 147, 243 Dictionnaires .........................................................20 Diderot .................................................................20 Difficult subjective .................................... 168, 170 Dixon .............................................................. 66, 69 Dottrens 33, 50, 120, 139, 147, 148, 150, 156, 159, 160, 164, 173, 174, 243 Draper ................................................................106 Dubois ........................................ 18, 21, 33, 47, 154 Ducharme ..........................................................101 Dupuy ........................................... 41, 44, 46, 67, 76 Durand ......................................................... 49, 152 E Earhard..............................................................106 Eckerson ............ 15, 29, 36, 39, 46, 53, 55, 58, 243 Effet Mathieu ................................................ 80, 123 Ehri ................................................................ 63, 79
Tables et Index
246
Ehrlich .... 21, 29, 35, 36, 47, 48, 50, 58, 59, 70, 77, 103, 104, 150, 154 Eller ..................................................................... 63 Elley ..................................................................... 63 Ericsson ......................................................132, 133 Estoup ............................................................22, 24 Etessamipour .......................................97, 118, 126 F Feeman ................................................................ 78 Fenouillet ...................................................134, 160 Fielding ............................................................... 80 Flieller ..............................................15, 58, 77, 179 Florin ................................ 21, 47, 50, 59, 62, 68, 78 Forest .....................................................68, 69, 137 Fradin.................................................................. 17 Fraisse ............................................................... 101 Franais ............................. 34, 51, 76, 121, 175, 208 Freebody ............................................53, 58, 78, 79 Freedman .......................................................... 113 Frre Gonzalo Carlos ...................................15, 33 Funk and Wagnalls ............................................ 54 G Garten ............................................................... 101 Geiselman ........................................................... 93 Geoffroy .............................................................. 24 Gildea .................................................................. 62 Glanzer ................................................................ 89 Gougenheim ................................. 25, 32, 33, 34, 35 Graves ............................................................53, 58 Gray .............................................................18, 115 Greaney ............................................................... 80 Gross ................................................................... 28 Guguen ............................................................ 169 Guiraud ............................................................... 22 H Haight.................................................................. 76 Harrison .............................................................. 81 Hartman ...................................................36, 37, 54 Havighurst .......................................................... 38 Haygood .............................................................. 33 Henmon ............................................................... 32 Herdan ...........................................................22, 23 Herman ...................................... 36, 53, 57, 62, 134 Histoire.......................... 51, 121, 147, 175, 208, 251 Hitch ...............................................................95, 96 Hollan ................................................................ 116 Howes .................................................................. 26 Hulme .................................................................. 97 Hunt .................................................................... 83 Huteau ............................................................75, 76 Huttenlocher ................................................76, 209 I Idiomes................................................................. 73 Imbs ................................................................20, 54 Inventaire ......................................................35, 243
J Jacklin ..................................................................76 Jamet ....................................................................78 Jenkins ..................................................... 68, 69, 78 Jensen ........................................................... 78, 118 Johnson ........................................................ 18, 115 Just .......................................................................79 K Kaplan..................................................................68 Karli .....................................................................90 Kirkpatrick.................................................... 36, 46 Koopmans ..........................................................103 L Lafon ....................................................................24 Lakoff .................................................................114 Landauer ...........................................................114 Larousse ................................................. 21, 47, 154 Le Ny ..................................................................114 Lebart ................................ 22, 23, 24, 26, 137, 141 Lecocq ................................................................106 Lecture ........ 186, 188, 191, 193, 194, 201, 203, 204 Lentin ...................................................................28 Levin ....................................................................67 Lieury .. 2, 36, 49, 50, 68, 69, 75, 86, 87, 90, 93, 94, 95, 97, 98, 102, 105, 106, 108, 117, 118, 119, 120, 122, 123, 124, 125, 126, 128, 129, 133, 134, 136, 137, 139, 140, 142, 145, 147, 148, 150, 152, 156, 157, 160, 161, 162, 163, 164, 169, 170, 171, 172, 174, 175, 178, 179, 186, 196, 208, 217, 243 Loftus ......................................... 111, 113, 115, 116 Lorge ................................ 38, 53, 54, 55, 56, 58, 59 Lyons ....................................................................76 M Maccoby ...............................................................76 Makkai .................................................................71 Mandelbrot .................................................... 22, 25 Mandler ..................................................... 102, 103 Massarenti .... 33, 50, 120, 139, 147, 148, 150, 156, 159, 160, 164, 173, 174, 243 Mathmatiques ................................ 51, 76, 121, 175 Mator..................................................................20 Mayer ...................................................................34 McCaslin ..............................................................65 McDaniel..............................................................67 McKeown ................................................. 65, 66, 75 Mercer..................................................................97 Mervis .......................................................... 18, 115 Meyer ................................... 26, 108, 111, 113, 114 Micha............................................................ 25, 33 Miller. 53, 54, 60, 61, 67, 72, 88, 99, 101, 103, 117, 133 Milner ..................................................................90 Ministre de lducation nationale ... 76, 152, 243 Moreau .................................................................63 Morineau .............................................................26
Tables et Index
247
Morton ................................................................ 59 Mots courants ..............................................168, 343 Mots drivs ......................................................... 73 Mots racines ......................................................... 73 Mots techniques ..........................................168, 343 Muller.............................................................22, 23 Murdock ................................................88, 89, 117 N Nagy .. 15, 36, 41, 42, 43, 53, 57, 62, 66, 70, 73, 79, 120, 134, 142, 174, 214, 217 O Omanson ........................................................65, 66 P Paivio ................................................................. 101 Pappas ................................................................. 63 Pearlstone ..........................................103, 104, 105 Perfetti............................................................65, 66 Pichot ................................................................ 127 Polson ................................................................ 132 Postal .......................... 115, 126, 128, 129, 130, 133 Pottier.................................................................. 17 Powell .............................................................68, 78 Prescott ............................................................... 33 Pressley ............................................................... 67 Primaire .......................................................199, 206 Putnam ................................................................ 18 Q Quaireau ............................................................. 26 Quemada ...................................... 18, 19, 20, 21, 54 Questionnaires Choix Multiples ..2, 37, 39, 40, 45, 46, 51, 58, 59, 66, 69, 71, 77, 119, 121, 122, 123, 128, 138, 179, 180, 181, 182, 183, 184, 185, 187, 188, 189, 192, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 206, 208, 210, 213, 214, 217, 244 Quid ............................................................126, 129 Quillian ...................... 108, 109, 110, 111, 114, 130 R Reder ..........................................................110, 128 Reichenbach ....................................................... 34 Reinert..........................................................26, 145 Rey ..................................................................18, 21 Richelle ................................................................ 63 Richman .............................................................. 41 Rips............................................. 111, 113, 114, 115 Rivenc.............................................................25, 33 Robbins ............................................................... 63 Robert ............................................................21, 75 Roenker ............................................................. 100 Roodenrys ........................................................... 97 Rosch ....................................................18, 114, 115 Rossi .................................................................. 138 Rumelhart ........................................................... 90 Rundus .................................................93, 100, 103
S Salem .......................................... 22, 23, 24, 26, 141 Salthouse ............................................................131 Sauvageot ....................................................... 25, 33 Schaeffer .................................... 110, 111, 113, 130 Schank..................................................................69 Schulman .............................................................38 Schvaneveldt ........................................................26 Seashore ............. 15, 29, 36, 39, 46, 53, 55, 58, 243 Selter ....................................................................76 Snchal ......................................................... 63, 64 Sexe ....................................................................185 Shannon ....................................................... 90, 108 Shibles ..................................................................38 Shiffrin ..................................................... 92, 93, 95 Shoben........................................ 111, 113, 114, 115 Simon ......................................................... 131, 132 Sixime (la) .... 2, 15, 49, 50, 51, 139, 147, 151, 157, 161, 176, 178, 179, 207, 209, 211, 216, 217, 243 Smith ..... 31, 36, 38, 39, 40, 41, 46, 70, 75, 99, 111, 113, 114, 115, 116, 130, 243 Solomon ...............................................................26 Stanovich ......................................... 78, 79, 81, 123 Stein.......................................................... 68, 69, 78 Sternberg ................................... 60, 67, 68, 78, 137 T Tardieu ...................................................... 128, 129 Templin .. 36, 38, 39, 40, 46, 60, 61, 70, 75, 76, 243 Terman ................................................................36 Ters .......................................................... 27, 32, 34 Thibaut ...............................................................15 Thomas ................................................................64 Thompson ..........................................................100 Thomson ............................................................107 Tiberghien .........................................................106 Tournier ...............................................................24 Troisime (la).............................................. 178, 217 Tsai .......................................................................80 Tulving .. 69, 94, 102, 103, 104, 105, 106, 107, 108, 117, 132 V Van Acker ............................................................49 Vander Beke .................................................. 29, 32 Vocabulaire ..... 33, 35, 150, 156, 157, 159, 174, 243 Vocabulaire technique ........................................243 W Walberg ...............................................................80 Walker ...............................................................116 Wallace ...................................... 110, 111, 113, 130 Watson .................................................................86 Weaver ......................................................... 90, 108 Werner .................................................................68 West......................................................................81 Wilkins ...............................................................115 Williams ...............................................................54 Wilson ..................................................................80
Tables et Index
248
Wood ..........................................................100, 106 Woodward .......................................................... 93 Wysocki ....................................................68, 69, 78 Y Yekovich ........................................................... 116
Yule ......................................................................22 Z Zipf ........................................................... 22, 24, 25

Dero 1998 Inventaire Du Vocabulaire Et Developpement Des Connaissances Du Cours Preparatoire A La Sixieme de College These de Psychologie Univers

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Dero 1998 Inventaire Du Vocabulaire Et Developpement Des Connaissances Du Cours Preparatoire A La Sixieme de College These de Psychologie Univers

Uploaded by

Copyright:

Available Formats

Universit de Haute Bretagne - Rennes 2 Laboratoire de Psychologie Exprimentale

Inventaire du vocabulaire et dveloppement des connaissances du Cours Prparatoire la Sixime de collge

Thse de Doctorat Unique de Psychologie Prsente par Mose DRO

A mes parents et amis

Table des matires

LES INVENTAIRES DE V OCABULAIRE ................................................. 29

3.2.2. Les travaux de langue franaise....................................................................................................... 47

LA CROISSANCE DU VO C ABULAIRE .................................................... 60

ORGANISATION ET MMO IRE .............................................................. 99

LA MMOIRE SMANTIQU E ............................................................... 108

LA MMOIRE ENCYCLOP DIQUE ...................................................... 117

CONCLUSION ....................................................................................... 134

INVENTAIRE DU VOCABU LAIRE AU P RIMAIRE ( TUDE 2) .............. 151

DIFFICULT DU VOCABU LAIRE DHISTOIRE EN 6 M E (TUDE 3) .... 159

RVALUATION DES INV ENTAIRES DU COLLGE ........................... 174

DISCUSSION ......................................................................................... 213

ANNEXES ....................................................... ERREUR ! SIGNET NON DFINI.

2. D E LA LEXICOLOGIE AUX AN ALYSES TEXTUELL ES

2.2. Lexicographie et dictionnaires

2.3. Lexicomtrie et analyses textuelles

2.3.2. Loi de Zipf et richesse du vocabulaire

1 1 10 100 1000 Rang des formes rptes

2.3.3. Les logiciels danalyses textuelles

2.3.4. Lexicomtrie et inventaire du vocabulaire

3.1. Les vocabulaires basiques des langues

3.1.1. Les travaux de langue anglaise

Date 1917 1917 1921 1923 1924 1926

Auteurs Andersen Houser, J. D. Clarke, F. V. Horn Crowder Horn

Sources Rdactions denfants

tendue de la recherche (en mots) 75 000

Liste propose 4 532 3 037 3 000 4 600

3.1.2. Les travaux de langue franaise

Le Vocabulaire fondamental du franais de Dottrens et Massarenti (sans date)

1 147 748 460 727

Sans date 1959 1969

2 716 1 465 7 961

3.2. Les vocabulaires destimation des connaissances

3.2.1. Les travaux de langue anglaise

A 331 mots B 331 C 329 D 329

173 mots de base gnraux S.E. Test Partie 1

158 mots de base rares

add-oil addend addends subtraction Addition-subtraction additional

addition ADDITION additions

additive additives Additives

Adulte 8 4me 9 3me 10 2nde 11 1re 12 Term.

Date Auteurs 1891 Kirkpatrick, 1907 E. A. 1902 Doran, E. W 1917 Gerlach, F. M.

28 000 250 000

6 887 4 000 5 000

8 207 6 000 6 900

209 000 450 000

QCM 4 choix Construction de phrases, QCM et dfinitions idem idem

450 000 450 000

Entretien et QCM 10 398

Websters Third (1981) 460 000

3.2.2. Les travaux de langue franaise

Le vocabulaire technique du collge franais de la 6me la 3me, de Lieury (1991 -1996)

total manuels Moyenne note la plus leve note la plus basse

3.3. lments de critiques aux inventaires

3.3.1. La source de lchantillon

3.3.2. Dfinir ce quest un mot

3.3.3. Dterminer quun mot est connu

4.1. Combien de mots par jour ?

4.2. Comment sont appris les mots ?