You are on page 1of 26

BCN3112 语文测验原理与实施

单元(五) 阅读与作文能力测评

5.0 内容提要:
本单元要讨论的是阅读与作文能力测评。

5.1 预期学习成果
学习了这个单元后,你将能够:
1. 举例说明阅读与作文能力测评的指标、方法和工具。

5.2 单元结构

阅读与作文测评

阅读测评 作文测评
指标 指标

方法 方法

工具 工具

基本阅读材料
BCN3112 语文测验原理与实施

 阅读测评

阅读测验指标

关于阅读测验指标的研究,早在本世纪三十年代,我国的陈礼江就提出“读法四
要素”。即从速度,理解, 组织,记忆四个方面来检测学生德默读能力。
在四十年代,艾伟对小学四至六年级学生的默读能力从以下四方面进行测验,其
中包括了迅速浏览,摄取大意的能力;精心详读,记取细节的能力;综览全章,挚取
纲领的能力;玩味原文,推取含义的能力。
国外的研究者也进行着类似的研究。美国教育心理学家 E. R. 代克提出阅读测验
应具备四个要素,其中包括了权衡句中各字,组织各字关系,选择各字含义,决定最
后反应。
美国的 A. I. 盖兹的默读测验分四种能力因素包括了了解主旨、预测后果、提纲
挚领和明了语气。
1978 年美国加利福尼亚州以法令形式颁布《基本技能检查的评定规程》,其中阅
读技能测查包括三项。第一是词汇,也就是测验辨别词语的意义。第二是理解,也就
是测验对文章段和篇的理解。最后是研究判断技能,也就是测验从字典中寻找恰当的
词义,并利用部分书籍去寻找所需要的资料
英国著名的“尼尔阅读能力分析测验”包括对准确性、理解力和速度的测查。而
英国中小学联合会的研究项目“阅读有效使用”,研究人员设计的阅读测验中包括以
下八种因素。第一是词义,也就是孤立的讲,第二是上下文的词义,也就是使用在某
一特定的上下文中的一词的词义。第三是字面的理解力,也就是一个只需要字面反应
的能力。第四是简单的推断,也就是由一个单句或者一个词组得出的推断。第五是综
合式的推断,也就是从许多句和词组中获得信息而得出的判断。第六是隐喻,隐喻是
对一段不能做字面上解释的文字材料的意义理解。第七是重点,也就是捕捉文章关键
点的能力。最后是评价,评价是理解了一篇文章的内容并将其与自己已有的知识相对
照后作出评价或得出定论的能力。
另外,日本的阅读教学界认为,阅读测验可分成四项指标。第一个是读字,也就
是认读文字的能力。第二是词汇,也就是单词的量和质的理解和运用。第三是理解而
第四是读速。
BCN3112 语文测验原理与实施

因为阅读分朗读和默读两种方式,所以拟定分析性阅读测验指标时,可以区分考
虑。我国心理学家在 1983-1984 年,对“中小学生语言的发展与教育”的研究中,分
别设计两套测验指标。尽管它们用于心理学方面的研究,但、对于我们开展教育测量
研究会有启发。
在前人和国外近期研究的基础上,结合我国心理学研究和教学实际情况,朱作仁
与 1981 年提出以理解、记忆、速度、辨别四方面作为检测默读能力的客观指标,并进
行了有效的实际测定。
第一个指标是理解。理解是阅读能力检测中最重要的指标。理解又可从以下方面
检测。其中是对课文含意的领会。具体包括解释词语、理解含义深刻的句子的意思和
明确语句之间的关系。再次是对课文的组织能力。具体包括了分段、概括段意,编拟
提纲,列小标题。最后是对课文主要内容和中心思想的概括水平。
第二个指标是记忆。记忆是要求学生在意识记的基础上,离开材料作口头或书面
的复述。在具体测验形式上,可以采用是非题、多项选择题、填空题、问答题等不同
题型。“记忆”这项指标与“理解”不同之处,在于“理解”是允许学生看着材料作
答的,而“记忆”则强调要离开材料,作即时重现。
第三个方面是速度。这项指标是测定学生单位时间内能读多少字,或读一定量的
文字需要多少时间。
第四个指标是辨别。这是指识别文章内容中错误成分的能力,例如分辨易于混淆
的词语或概念,进行逻辑性的改错训练等。辨别和评价能力密切相关。因此也应作为
一项检测指标。
根据殷晋农关于阅读理解的分类,本身也是一套全面而有参考价值的阅读测验指
标。阅读理解水平包括了字面理解,字面理解的认知操作水平有记忆和翻译。字面理
解的具体项目是理解词的意义、识别和回忆中心思想、识别和回忆细节、识别和回忆
顺序、识别和回忆比较、识别和回忆因果关系和识别和回忆角色特征。
第二个阅读理解水平是解释性理解。解释性理解的认知操作水平包括了解释、运
用、分析和综合。解释性理解的具体内容包括了推断有意义的和起支持作用的细节、
推断顺序、推断比较、推断因果关系、推断或预期结果、推断中心思想和推断或作出
结论。
接下来,第三个阅读理解水平包括了批判性理解水平。批判性的认知水平只有评
价,也就是判断人物情感和心理、判断真实与虚构、判断事实与观点、判断作者的资
格和判断或觉察宣传手法,修辞手法。
BCN3112 语文测验原理与实施

阅读能力测评方法
 朗读测验
朗读测验具有与默读测验在测量内容、表现内容、表现方式、操作程序等多方面的差
异,故设专节介绍。
 朗读测验的特性
1. 有较强的可测性
朗读由于有明显的、可观测的外显表现,所以比较容易检测,它是语言中最典型的直
接测验。比起对内隐的心智技能操作活动作测验的默读测验,它显得便利。
2. 独特性
速度以每分钟读字(词)数计算;质量则按照朗读要求,从正确,流利、朗读技能
(停顿、重音、节奏、语调)有感情几方面评分。在朗读的测验中,理解力可以从流
利、速度、有感情等方面显露出来。与默读比较,量较低级的理解水平上,如“字面
的理解”、“解释”有独到之处。
3. 有良好的分析性和诊断性功能
朗读测验在诊断学生认读能力,阅读困难和检查对所读内容的理解方面有用武之地。
在西方国家,诊断性朗读十分流行,如美国有名的量具有门罗诊断性阅读( Monro
Diagnostic Reading Tests ) 、 盖 兹 - 麦 基 罗 帕 阅 读 诊 断 测 验 ( Gates-Mckillop
Reading Diagnostic Tests ) 、 达 累 尔 阅 读 困 难 分 析 量 表 ( Durell Analysis of
Reading Difficulty ) 、 斯 拜 契 诊 断 性 阅 读 量 表 ( Spache Diagnotic Reading
Scales)、博塔尔阅读量表(Botel Reading Inventory)和标准阅读量表(Standard
Reading Inventory).
4. 一般采用个别测量方式
这个特点保证了朗读测验的效度,但是影响了它的效率。

 朗读测验的指标与工具
在小学语文教学大纲中,对小学生的朗读要求是正确、流利、有感情,这三
项要求的层次是逐步提高的。首先是正确地读,要“用普通话,发音清楚响亮,不读
错字,不丢字,不添字,不唱读,不重复字句”。在正确地读的基础上做到流利地读。
流利地读是不断读、不停顿、不读破句。有感情的读要求正确地处理重音、停顿,运
用适当的语调、速度和节奏,做到感情自然流露,不娇柔造作。
BCN3112 语文测验原理与实施

美国阅读教学专家编制了哈里斯的检验指标。检验的主要项目有流利、断句、
有感情、词汇、识别、语音和姿态。这指标具有分析朗读行为地使用价值和集中学生
在朗读时常表现出来的各种重要的反应。
与默读相比,朗读水平比默读差、速度比默读快和朗读之后理解反而差。要
知道学生能不能流利的朗读就要看学生的反应如逐字读、单调死板,不能随材料意义
而变换、忽视标点符号,一直往下读、断句能力差、含糊不清、重复、朗读速度缓慢、
快而不稳、 迷失所读之处。
在词语识别,一般表现有一见即认识的词语少、常用词的读音错误多、不能
顺利地扫除生词障碍、插入多余的词、删去应有的词和跳行。
在应用上下文时学生常表现出来的有过多地从上下文去猜测意思、难以利用
上下文的帮助来认词、以近义词为代用词、以形近异义词为代用词、省略或跳过不认
识的词、犯有损害或改变原义的错误、乱读一气,不知所云以及在上下文中能读准词
音、读单词时则有错误。
分解生字难词时,学生应拼写并尝试发音如单个字母、音标和音节。懂得应用
字体的结构、大小和形状。还要主要注意词的某一部分如开头部分、中间部分和末尾
部分。分析词的构成要注意前缀、词根和后缀。另外学生常出现的问题也包括在分解
词时缺乏灵活性和无法攻克生字难词关。
在词语分解上的特殊困难有听觉分辨力差、不能合成次、没看清楚、有词语颠
倒的倾向、字母混淆和语音知识缺陷。语音知识缺陷包括辅音字母、短元音字母、双
元音、分音节、后缀、辅音合成词、长元音字母、词系和前缀。
声音运用方法有发音清晰度差、词尾读音的省略和减轻、含糊发音和连续发音、
语音的代替、结结巴巴、杂乱无章、读音中表现出神经质或紧张。音响应适中不要太
强或太弱。音调也要适中,避免太高或太低,以及避免怪声怪气。
阅读姿势习惯有如拿书距离太近、读书姿势不对、阅读时摇头晃脑、书拿不稳
和用手指读。
 《非正式阅读测量查表》(IRI)的施用
《非正式阅读测量查表》(informal Reading Inventory)英文缩写为 IRI,由美国阅
读专家迈尔斯.津茨提出。所谓 IRI 有别于标准化得阅读测验的一种个别测验。它的功
能是检测学生的阅读能力水平,也用于估计一本书的难易度和进行教学诊断。有时也
用于估计一本书的难易度和进行教学诊断。IRI 全套测验材料包括各年级水平的一系
列文章的编选。每篇文章后附有检查理解力的测验题。除了学生所用的材料,还可配
BCN3112 语文测验原理与实施

上与教师所用的内容相同的对照本,供测查时记录学生阅读中出现的错误、评定阅读
成绩。其测验方式是朗读、默读、听读的综合运用。
 IRIS 的编制
首先教师准备好测查材料。教师可根据各年级程度,从课本或书籍中选出一组
文章。其中一个年级程度有两篇文章,一用作朗读,一用作默读,内容最好有直接的
联系,比如:一本书中上下两个节段。词数要求,大致是为低年级约 60-125 个词,高
年级多一些,约 100-200 个词。
此后,围绕文章设计五至七个左右的理解测验题。题目尽可能测出学生的理解
能力。题目的程度要适当,大体可分为这几种类型如事实性或记忆力、根据上下文获
取意义的推理性题目、测验概念和词语的题目和测验学生运用上下文预测意义的能力
的题目。
另外出题目时要以阅读材料为依据。不要从学生已知的东西提问也不要出简单
的“是否”题。选文和编题完毕要检查修改,必要时试用一下,看看是否适合学生程
度。
 IRIS 的应用
教师让让学生朗读和默读由易到难,依年级程度递进的测查选文,读完一篇文章做有
关理解测验题。到了一个年级段,学生自己不能很好读下去,就让他听读(教师读,
学生听)文章,口头回答提问,由此判定学生的阅读水平。
贝兹(E.A. Betts)通过研究确定了四种阅读水平的衡量标准即独立性阅读水
平。 朗读正确率为 95%(即阅读一篇文章平均每一百个词中错误不超过五个词),理
解率为 90%(如果十个理解测验题答对九个)。所谓“独立性阅读水平”是指儿童在
相应课文中的单词识别率和理解率都很高,他们能自己读懂课文的大部分内容
第二是教学性阅读水平,阅读正确率为 90%,理解率为 75%。儿童虽然不能独立
地读懂材料,但通过教师的帮助和教学能读懂材料。
第三则是受挫性阅读水平, 阅读正确率为 25%以下,理解率不到 50%。即使在
教师的协助和教学后,仍然不能理解,儿童受到挫折
第四是智能性阅读水平,又称听力理解水平、听读水平。理解率为 75%。
要判断一个学生是否处于阅读受挫折的状况,我们也可以从他读书的外显行为来
观察。据据教育心理学的研究,在这级水平的学生往往紧张不安,呈神经质的表现,
通常会出现过度的身体动作如坐立不安、顿教和搔头。另外还会有不规则的眼动如一
行文字重复读和颠倒词语。
BCN3112 语文测验原理与实施

此外还会出现理解力差那就是不能预测意义和不能记住内容。学生还会出现注意
力不集中、读音毛病、阅读速度太慢、视音距短、出声读或唇读和朗读问题如重复、
省略、颠倒、代替和添。
 IRIS 的意义
让一个学生读二上年级的文章,朗读时错词率没超过 15%,理解测验题正确率在
90%以上,就说明他读二年级材料时为“独立性水平”。绕后然他读二下年级材料,朗
读正确率为 90%左右。理解率为 75%左右。再读三年级材料,成绩亦然,则表明他处于
读这两级材料的“教学性水平”。接着让他读三下年级材料,他朗读错误已超过
25%,理解率低于 50%,说明他已处“受挫性水平”。再由教师把三下年级的材料读给
这个学生学生听,如果他理解的正确率在 75%以上,说明他的“智能水平”在三下年
级或更高一层。
这里提出的“智能性阅读水平”是个很有价值的概念,因为用它可标明阅读者的
潜在阅读能力和素质。如上例的学生教学性阅读水平为三上年级,而智能性水平为上
四年级,他阅读的延带时间为一年,这显示了他潜在的素质比现有的阅读能力高。
IRI 也可用于测度文章的可读性。比如选一批文章,让一组标准年级段的学生阅
读。根据阅读正确率指示(90%)和内容理解率(75%),基本可以确定哪些文章符合
该年级学生的教学性水平。
 1/20 规则
根据上述标准,美国阅读专家孚蓝博士(Fry)提出了更简单的 1/2 规则,这也是用朗
读测验手段检查学生阅读能力水平的一个有效程序。其做法是要求学生朗读文章。如
果平均每二十个词中错误不到一个词,则为独立性水平;如果错误率约为每二十个词中
有一个词,则处于教学性水平。如果错误率高于二十分之一个词,则是受挫性水平。
 对 IRI 的评价
根据专家们介绍,IRI 的方法有如下优越性。教师用到的材料随手可得,不必花钱,
即方便又经济还可以可以迅速、直接找到需要的答案。另外,教师可从学生用书选材,
比其他测验材料更有效。方法适于个人及集体班组让学生能及时了解自己的阅读成绩。
教师可以比较学生的进步程度并可观察具体的表现,可选用一些有趣味性的读物,已
符合儿童心理。此外,IRI 也能检测教材中课文的可读性和具有考核的作用,还能收
到教学的效果。

默读测验的方法 (朱作仁 pg 245-263)


BCN3112 语文测验原理与实施

 默读速度的测定法

测定默读速度的基本方法可分为:数字法、计时法、悬牌法、划记法、消字法和机
器测速法。

 数字法:
先让学生默读测验材料,到一定时限叫大家停止读。在最后读的那个字画圈。
测速时,把该生所读的总字数除以默读的时间即可。美国布朗(H.A Brown)的默读测
验就采用此法。让学生默读一分钟,事先告诉学生读后要复述内容,一分钟后叫停止读,
把最后读的字圈出。该测验的速度分可以每秒针读多少个字。这个方法的缺点是数字
的手续太烦,并且不一定正确。

 计时法:
先提供学生阅读测验材料,全部读完后,把阅读所用的时间记录下来。计时法
适于个别测试。格雷(GRAY)的默读测验就是这样。进行测验时,测验材料有三篇不同
的故事。每篇材料分三段,以中段最长。测试时有主试记下被试读中段所用的时间数,
把中段字数除以读的时间,就可求得被试在但是时间内的读字数。

 悬牌法:
使用许多阅读定量的测验的材料。让学生读完后,分别记下当时主试所示速度
牌上的数字。这是团体测试场合的测速法。(C.R Stone)的 默读测验分三类,每类
两篇故事,开始测验时,主试每五秒在黑板上挂一块速度牌,被试读完故事后,立即
把这时速度牌上的数字记载测验卷上。为防止被试者作弊,速度牌上最好不直接用标
示时分的数目,而采用代码。

 划记法:
在举行阅读测验时,主试每个若干时间按铃一次。被试者听到铃声,即划一个
记号在所读到的字数,直到读完为止,然后计算划记次数。计速时,先数被试在阅读
文章上所划的撇数,以撇数除以全篇字数,在乘以六,即得到该被试每分钟的字数。
该方法的缺陷是对阅读有干扰,与正常的阅读情形不符。

 消字法:
在测试材料中,加入一些多余的字,让被试在默读时随时划去。就可由划去字
数核算越读字数和速度。例:查普曼(Chapman)的测验,有 11 段文字,每段各有 30
个字,各段中都插入 1 个多余字,测验时要被划去多余的字,阅读时间加以局限。这
是一个可行的办法,但是因多余的文字的划法,难易不一,所得结果已非纯粹的速率
了。

 机器测速法:
如用速示器测定读速;用眼动摄影仪,根据读者眼停次数和每次眼停的时间核
算阅读速率。以电子计算机测定读速,让被试在计算机终端前阅读文字材料,阅毕即
在指定按钮上按一下,计算机就可以立即算出阅读速率。
BCN3112 语文测验原理与实施

阅读理解的测验法

1.)从阅读理解技能因素看测试手段
方法为目的服务。阅读理解力的测验方法与将测定的技能指标紧密相关,有效
的阅读速度应包括理解水平。阅读测试题项目分析图可分为字面的理解和解释的技能。

字面的理解:
-基础技能
学生需要扩大词语的概念。其中包括运用句子的其他部分确定词义。进行词义
配对、词语分类、选择同义词、辨识句子中思想的顺序、确定句子说明的是原因、时
间还是地点、懂得代词所替代的先行词。
除此,学生必须寻找和记忆细节。再了解和领会指导语以及段落的结构。学生
也必须从上下文理解意义。为寻找答案而阅读。从一段文章或一个故事中找出中心思
想,并在故事中按适当的顺序表述思想。

解释的技能 :
第一项是说回预测意义,这是一项完形测验。学生必须预料下文的发展。再引
出推论、作出概括。在选择与设想时,学生必须选择与特定题目有关的资料,扩大或
虚构的措辞,再判断对所读内容的情绪反应。

阅读理解的基本测验方法
可分为十大类:
1.)文图相联法
- 在测验卷里文字和图示一起出列,要求考生根据对文句的理解,把图与文相
联,或由图选文,或由文选图

2.)正误辨析法
-让考生阅读文句,根据其理解的意义,对试题内容进行辨析,指出对或错。

3.)执行指令法
-要求考生阅读字句,根据里面的指示作出反应。

4.)复述内容法
-要求考生阅读文章后,复述其内容,书面或口头均可。

5.)回答问题法
-在测验的每段文字后,列出几个问答式或其他形式的试题,要求考生根据阅读
材料,笔答几个问答式的试题。

6.)确定要旨法
-让考生阅读一段文字后,根据测验题确定本段的中心、主题或概要。

7.)预测结果法
-让考生阅读一段文字后,根据文意来推测将要发生的事实与后果。

8.)情感体察法
BCN3112 语文测验原理与实施

-让考生考生通过阅读文章后,体会文中人物的情感。

9.)文句评鉴法
-通过考生对一段文字阅读,考察他是否能客观评价作者的写作意图与写作方法,
或鉴赏文中佳妙之处。

10.)排列次序法
-要求考生着按照事实发生的先后,将提供的句子依照次序排列出来

完形测验法 ( 朱作仁 pg 263-270)


又称完形填充测验(close test or cloze procedure)(美国心理学家泰勒—
1953—首创的阅读方法)根据泰勒的定义,完形测验法是从发送者(作者或说话者)
那里截取一段消息,删去其中的部分东西以破坏它的语言模式,然后把它交给接受者
(读者或听话者),让他们设法用自己的潜在能力使模式重新完整,形成完形单元的
测验方法。

完形测验的编制与应用

完形测验的制作方法事:把一篇文章 — 按一定的规则和要求随机删去单词,
让读者边读边将删去的词重新填上。填对词数与删去的词的总数之比叫做填对率。读
者的填对率的平均 — 文章的难易读指数。
完形测验通常采用两种记分法。一种是读者填的词与作者的原词完全一致才给分。另
一种是,学生填的词是原单词的同义词也可适当给分。前一种方法的答案是唯一的,
积分比较客观,所以易给学生带来挫折感;后一种的答案多样化,记分主观(评分标
准难把握)有助于鼓励学生发挥预见能力和创造力。

兰金在研究中提出两类不同性质的完形测验。在他的博士论文(1957 年)中把
完形测验划分为两类:(一)结构性完形测验(二)内容性完形测验(词汇性完形测
验)
结构性完形测验是指每隔几个词删去一词(大部分删去的词本身并无实质性的
意义的结构性单词,如介词、冠词等)通常是有有固定搭配方式,易猜到结构性词语,
但是要完整猜对删去的名词或动词是不太可能的事。
内容性完形测验(词汇性完形测验)是采用删去第 N 个名词或动词或形容词的
方法(词对文章具有实质性的内容)兰金建议根据不同的测试目的和具体的测试对象,
实施不同的完形测验。

完形测验与我国教师常用的填充题从形式上来说大有不同。完形测验的特点是
删词的随机性,与编制者的主观性无关。而填充题的特点是删词由教师主观意图决定。
在材料的选用上完形测验也较长,删词的数目须超过一定的量。但是填充式的材料较
短,删词的数目有限。功能方面对比,完形测验适合用于考察文章的难易度及评价学
生的阅读水平;填充式则用于测量学生对某些单词或某种句型的理解。

(二)汉语完形测验研究
1983 年开始提出把完形测验引入汉语阅读测验这一设想,并开始做了先行的探
索工作。在 1985 完成的《中国小学毕业生默读量表 A-1》中,设计了《“知识长进
率”测验》它的编制方法是:(1)学生做一篇的完形测验,然后让学生阅读未删减的
材料原文,读完后再让学生做同一篇材料的完形测验。后一次删词(与上次的密度一
BCN3112 语文测验原理与实施

样,但删的词不一样)。二次完形测验填对率之差称为“知识长进率”知识长进率指
标的信度和效度较好,知识长进率成绩与阅读理解成绩的相关达 0.7。1988 年,柯孔
标在导师朱作仁教授的指导下开始了汉语完形测验的专项研究。

阅读测验研究成果
在听、说、读、写诸项语言能力测验中,阅读测验应用最为广泛。阅读测验类型比较
多,按测验目的划分可作如下分类:

概观测验
对学生的阅读水平有一个总体的测量,其测定结果一般以单一成绩表示。大多数的概
观测验有两部分内容,第一、阅读词汇,第二、篇章理解。但是,也有部分概观测验
包括对阅读句子和读速的测量。

分析测验
分析测验倾向于将测量目标作精细分解,针对各个项目分别测验,因而能起诊
断作用。盖兹---麦金蒂阅读测验(The Gates—MacGinitie Reading Test,1964)。
在美国的“小学阅读测验图”(Primary Reading Profits,1967 Edition),分两级
水平。每级包括五个分测验:阅读性向、听力联想、认词、词的分解和阅读理解力。
在中国,艾伟、杨清编的《小学国语默读诊断测验》按测试要求划分,分为两
大类:速度测验和难度测验。凡阅读速度的专项测验归类于速度测验,后一类主要是
阅读理解力测验。现在研究的趋向表明,用分测验的方式,分别对读速和阅读理解力
加以测试,这样的综合测验是比较合理而全面的设计。
初期如:【陈鹤琴《中学默读测验》、《小学默读测验》】【艾薇《国文理解能力测
验》】【华超《新学制国语教课书阅读测验》】【艾薇、王全桂《小学国语默读测
验》】80 年代:【朱作仁、李志强《中国小学毕业生默读量表》】【殷普农《上海市
小学阅读理解标准测验》(1987)】
该试验将阅读理解按三种水平:字面理解、解释性理解和评判性理解水平划分,并更
精细地分析了测验的具体项目,是一种典型的分析性默读测验。

主要阅读测验举例
 艾伟,杨清编《小学国语默读诊断测验》
测验特点:
此测验是一种诊断性测验,而非预测性测验。研究工作符合诊断性测验编制要则:
第壱、 所测的技能必须能把综合的行为分解为各种成分,而又不破坏总体行为
的性质。
第弐、 必须有几个分测验或量表,每个只测验一种成分,整套测验要把所有的
技能成分都测到。
第参、 每个分测验或量表内部应是同质的,或至少测量那些在某种意义上是不
可分的技能组合。
第四、 分测验的分数应当对补救工作有指导意义,亦即从分数模式中能直接推
断出适当的补救措施。
测验分类:
测验分为 四类,每类分别诊断一种技能,其目的是测量那些阅读能力低劣的儿童,加
以分类分析,究其原因,提出纠正与补救建议。
(壱) 测量学生迅速浏览摄取大意的能力,即略读的能力。
BCN3112 语文测验原理与实施

例子:阅读小说、故事。

(弐) 测量学生细心阅读记取细节的能力,即精读的能力。逐句细心阅读,不
得疏忽一字。

例子:阅读算术、自然科学以及深奥理论书籍能力。

(参) 测量学生综览全章挚取纲领的能力,即学生能从错综复杂的文章里找出
一个系统的纲领或因果关系。例子:读历史或作文章的纲要。
(四) 测验学生玩味文字,了解寓意的能力。这近似理解能力。例子:读寓言、
童话、猜谜。

以上测验适用于四,五,六年级的学生。如果学生受本测验后,教师可以发现学生阅
读能力的缺陷在何处。如果发现学生玩味文字的能力低,就指导学生阅读寓言,童话
等材料。

测验选材原则:
1. 从最通行的儿童读物和小学国语课本中选取。
2. 须为小学五年级儿童所读过或应读过的文字。
3. 需配合测验的功用:第一类测验应选故事等类的材料;第二类测验应选自然等
类材料;第三类测验应选历史等类材料。
4. 用字尽量避免生冷奇僻。
5. 每篇文章字数以一百字左右为限。
6. 凡带有韵律文字,一概不选,以求材料本例一律。
 朱作仁、李志强《中国小学毕业生默读量表》

研究制定本量表的目的:第一、提供一套测量中国儿童(汉语)阅读水平的客观、科
学的度量标准和工具。第二、用以测试以汉语为第二语言的学生的汉语基础阅读水平。
第三、推进我国教育测量的科学化、标准和实用化。

 莫雷等编《语文阅读水平测量》
量表特点:
其目的是测量学生的语文阅读成就,客观地确定学生语文阅读水平在群体中的相对地
位。编制者把语文教学目标分为五个范畴:理解性阅读,保持性阅读,评价性阅读,
应用性阅读和快速阅读。量表共分三套,适用对象是小学六年级、初中三年级以及高
三三年级。每一套分量表中包括 4 个分量表:
1. 语文基础知识。
2. 文言文基础知识
3. 文章阅读
4. 快速阅读

使用要则:
本量表的测试题卷前附有预备练习,以提高测试信度。各分量表前有统一的指导语。
BCN3112 语文测验原理与实施

 作文能力测评

a. 指标

(壱) 小学作文测评指标
根据写作能力结构要素和作文教学目标的分析,以及作文测评指标的要求(一
致性、易测性、全面性、独立性和明晰性),拟定出小学作文指标 12 项目。

作文能力结构要素
作文测评项目 教学目标
经验概括法 因素分析法
审题能力 1. 审题
审题立意能力 中心明确
立意能力 2. 立意
内容具体
3. 材料
搜集材料能力 选材能力
4. 思想 思想健康
5. 详略(写)
确定详略的能力
6. 开头结尾
布局谋篇能力 条理清楚
7. 层次分明
组织材料能力
8. 构段合理
9. 通顺、用词正确、 会用最常用表达方式
无错别字、标点符号正
语言表达能力

应用修辞手法的能力 10. 修辞 会用最常用修辞手法

(弐) 斯科内尔的《英文作文评分计划》
英国 F.J. 斯科内尔编制的《英文作文评分计划》,分三项项目十个因素。第
一项是思想内容和词汇、第二项是结构和第三项是技能的准确度。
BCN3112 语文测验原理与实施

思想内容和词汇(12 分)有四个因素,第一,思想清楚有连贯性、第二,有独
创见解、第三,题材有意义或没有意义、第四,用词。
结构(7 分)有三个因素,第一,句子的多样化:连接词和句型、第二,句子
的构造的正确性、第三,分段和协调性 。
技能的准确度有三个因素,第一,字母拼写法、第二,标点、第三,语法的正
确性。

(参) 特罗丝的《作文整体评价项目表》
美国作文教学专家玛丽•安妮•特罗丝列出的评定项目表有八个项目,分成三个
评分等级也就是低、一般和高。

(四) 赵宝伟等人的作文评定项目
依据教学大纲制定小学四年级和六年级作文的测评指标。有八个项目分别是:
思想(10%)、中心(15%)、内容(20%)、条理(20%)、语句(20%)、书写
(5%)、错别字(10%)以及标点符号(5%)。

(伍) 《创造性作文测试指标》
美国博尔大学教授,创造心理学专家郭有遹曾设计了一个创造性作文的测评标
准。该测评标准有四项。第一项是流畅性就是每个不同的注意算 1 分。第二项是多样
性就是以纲目或主意多少为标准。第三项是独特性就是有独特的见解,或引证的卓越
程度另外加分,加分的方法以五级量表为依据。第四项是周全性就是每一论点必须旁
征博引,充分发挥。

(六) 希尔里奇的作文测评标准
美国作文教学专家希尔里奇也曾提出过一个有“创造性”的作文测评标准。它
是由五个测评指标(组织结构、用词造句、创造性、流畅性、技巧)和四级计分组成。

(七) 日本《国语能力表》中《写作能力(作文)项目表》
《国语能力表》是个法规性文件,它兼有指导制定具体的教学目标和解析一般
的听说读写技能的作用,因此分别列出了“听、说、读、写(分写和书写)”能力项
目作为评价的范围和标注。

b. 方法

(一)作文测评方法的分类
作文测评方法的分类有三种。而这种“分类”,又是依各家的实践与研究角度
而有不同。第一种是从“原子的”到“整体的”测评方法、第二种是台湾学者的分类
法和第三种是特罗丝的作文评改三方式。
BCN3112 语文测验原理与实施

从评分的一般方式,有“印象评分方法”与“分析评分法”两大类。随着研究
的深入,国外的教育测量学家和作文教学法专家又提出了从“原子的”到“整体的”
作文测评方法。“原子法”指分别对写作的个别特征元素(如词、句、语法、修辞或
写作知识等)进行计算并合计的测评方法。而“整体法”则是把全篇文章作为一个完
整的单位来测评,它包括整体方法、基本特征法和用于评定全篇作文的分析量表等。
这种分类实质是按测评单位的分解与综合的不同程度而提出的。

台湾学者的分类法。台湾学者黄元龄在《心理及教育测验的理论与方法》一书
中提到作文测评方法有四类(1) 作文基本能力测验法。就是将作文能力分析为若干种
基本能力,例如:改正错字,删除累赘字词,选择相对字,造句,解释,标点运用,
语句重组等,分别编成客观测验,加以测量,然后综合这些测验的成绩,以评定学生
的作文能力。(2) 多段短文写评法就是要学生分别作几段短文,每段短文订有一定的
评分标准。然后以学生所得的几段短文分数的总和,作为他的作文成绩。(3)作文量表
法是要学生写一篇文章,再拿他的文章和作文量表上的样卷比较。然后根据该篇样卷
的分数或等第作为所测量学生的作文成绩。也称“参照作文量表”。(4)作文评定量表
就是先分析作文品质所包含的几种特性,列成几个评定的项目,制订成作文评定量表。
再将学生的一篇篇作文,按评定量表上所列的项目标准加以评定,最后综合评定全篇
的成绩。

特罗丝的作文评改三方式。美国作文教学专家玛丽•特罗斯把作文评改分三种方
式:教师评改、自我评改和同学互评。教育心理学家认为,教师评改是教师起主导作
用,具体指导学生写作,同时根据反馈信息调节今后的作文教学,有效地提高学生写
作质量。自我评改作文方式要求学生以批判的态度看待自己的作品,注意分析成功与
失败之处,找出优缺点,尽力改进提高。同学互评采取分小组的形式进行。它有利于
同学之间取长补短,互相观摩,互相学习。从学生心理而言,同伴的建议似乎比教师
的评语更能接受。

综上所述,作文测评方法分类主要有:(1)从测验单位与评定的客观性分,有客
观测验法(采用客观题型)、多段短文写评法、全文评测法(又称“长文测评法”)。
(2)从评定的范围与方式分,有综合式(或称整体法)、分析式(或称原子法、元素法
几分点法),以及介于两者之间的“混合式”、结合运用两者的“结合式”等。(3)从
测评量具来分,有教师自编的测验和通用的标准化量具。后者又有三种型式:(1)参
照量表;(2)分析量表;(3)分项测验。

(二)作文评定方法简介
(壱)分项评定法
分项评定法是根据作文能力的结构要素或作文教学的具体目标,编制成相应的
评定标准,从而逐项评价作文成绩的一种方法。
台湾方炳林提出作文评定项目有五项:结构(30%)、修辞(20%)、意境
(20%)、文体(10%)、态度(20%)。杭州大学教育系教学法教研室以朱作仁教授为
主指导编制的《小学六年级命题作文量表》共分七项:立意(25 分)、内容(25 分)、
BCN3112 语文测验原理与实施

思路(15 分)、段落(10 分)、字词句点(20 分)、书写(5 分)、附加分(5 分)。


美国希尔里奇为中学作文评定提供的分析量表共分五项:创造性、组织和形式、技巧、
句子结构、易读性。台湾赵友培先生设计的作文评分项目有五项:对题 20%、用字
20%、造句 20%、结构 15%、含义 25%。其中“对题”是指作文是否切题;“用字”是
指有无错别字;“造句”是指句子是否通顺,“结构”是指文章层次条理是否清楚;
“含义”是指内容是否真实、健康。

(弐)按错计分法
通过分析文章中的错误和缺点来评定作文的优劣。据分析,用“按错计分法”来评
定作文成绩的信度,在小学六上年级和初一下学期均在 0.80 以上。安德森
(J.E.Anderson)的混合英文测验中作文部分的计分法就是“按错计分法”。评分者
对学生作文评定时,只计错误。具体做法是计算学生的三类错误数:拼写错误、文法
错误和大写错误。如果一个词三种错误都有,只作一个错误计。对病句,评分先把应
删的词划去,再加入最少限度的词使之合于文法和意义。此时,把加入的词数作为文
法错误。记分公式为:
N2
2( )
100( M  1)
其中:N=全篇字数
M=错误总数

(三)T 单元分析法(T-Unit Analysis)


通过计算作文中每个 T 单元所用词数来估计学生作文水平的测评方法。
(词)量统计法计算公式为:
全文总词数
每 T 单元词数= 全文T单位总数

它是作文测评法中最有特征的“原子式”。在英文作文评分中,由经过培训和
富有经验的评定者采用 T 单元法可有很高的信度。这种评定法适合于常用文体写作,
对非典型文体如诗歌、意识流手法或新海明威派散文体之类不能用。尽管这种方法是
客观性评定、但它只是对有关写作水平的测量,并不具有诊断性功能,向人们提供不
同年级学生每 T 单元用词数的参考指标。
T 单元法作为英语作文测评方法,它对我国汉语写作测评研究的意义在于启发
我们去思考:(1)如何用字(词)量统计的方法来测量作文成绩?(2)从汉语语法
分析角度来看,能够或者有必要找一个类似“T 单元”的结构部分吗?(3)研究移植
这类方法的信度和效度如何?等等。

(四)多方评分法
它是分别由两个或两个以上的评分者给同一篇作文判分,最后把评出的几个分
数相加,求其平均值即得到该篇作文的成绩。计分公式为:
x 1  x 2  ......  x n
x=
n
BCN3112 语文测验原理与实施

这种评分法旨在使个别评分者的可能失误减少或抵消,提高评分的可靠性。但是因此
要增加评分工作人员,而且多方评分法可能会掩蔽个别评分者的敏感和创见,除非大
部分评分者都卓具才华,那么这些创见才会闪烁出智者之光。英国学者威斯曼提倡的
“快速印象法”基本上属于这种方法。“快速印象法”评分过程是由四个评分者根据
总观印象分别对同一篇作文迅速判分,然后对四个评出的分数加以核查。如四人的评
分基本一致,则可得出分数;若其中一人与别人评分明显不一致,则可摒弃那个人的
评分。采用多方评分法已为教育评价专家的研究所证实,是有科学根据的。

(五)分项综合评分法
分析评分法与印象评分法的合并,既由一个评分者先按照预先拟定的评分标准
诸因素分项给作文打分,然后再给以汇总的积分。这样做手续上多了一步,但显然比
光凭总体的印象笼而统之的评分强得多,同时也避免因单项分析评分而引起的问题,
使用这种方法的基础是拟出一份合理适用的评分标准。方渭泉采用“作文四步骤判分
评改法”中拟用的四项标准:
1)书写格式(15%)分三级:5 分以下;6-12 分;13-15 分
2)质料立意(25%)分三级:10 分以下;11-20 分;21-25 分
3)布局谋篇(25%)分三级:10 分以下;11-20 分;21-25 分
4)语言表达(35%)分四级:10 分以下;11-20 分;21-30 分;31-35 分
我国高考的作文评分基本上属于这种方法。

(六)九堆评分法
这是一种相互比照评定某一学生作文在某一批作文中相对地位的方法,属于相
对评定。
采用九堆评分法来批改作文卷是教师们多年的经验总结。具体做法是:(1)教
师先做第一次评阅,订正作文中的错误,依照评分与总体的概观把作文分上、中、下
三个等级,分开就置。(2)教师分别检查各堆作文卷,并把每一堆再细分出上、中、
下三级。这样,全部作文共有九堆:上上、上中、上下、中上、中中、中下、下上、
下中、下下。(3)教师需把九堆作文卷检查一遍,注意把每堆中不符的卷子作升格或
降级处理,力求使每份作文各得其所。(4)教师依次给每堆作文每篇作文评分。一般
来说,这样的评分在等级上会出现偏差,但从一个总体内的评分看,比较客观。依全
班人数之百分比,一般上上 4%、上中 7%、上下 12%、中上 17%、中中 20%、中下 17%;
下上 7%、下中 7%、下下 4%。因为这是相对评分,所以这个班级的九堆评分法的分数
可能与另一个班级分数难以比较。

(七)参照量表法
这是最先采用作文量表来评分的方法。这种评分法是聘请一些有经验的教师或
专家给一系列作文样本评分,在此基础上统计分析,构成一套作文评分实例量表。每
个实际范例都明确标明一种评分等级标准。使用时,教师们只要把要评分的作文与该
BCN3112 语文测验原理与实施

量表的范例相对比,依照相应的范例的标准分数,就可评出文章的分数。其优点是在
需要最短的时间评定大量作文时,可以防止标准的“自流”现象。

(八)整体评价法(Holistic Evaluation)
整体评价法一反过去作文评分只由教师或主持考试者负责的传统,让与作者本
人及其同学一起参加作文评分。这种评分法是对作文的各项目进行迅捷的、有指导的
计分法。它不是对文章的某一部分做逐字逐句的批改,而是评价全文的得失,指出不
足之处,为修改文章提供建议,这就是“有指导”。评分时由评价者整体阅读一遍文
章,同时考虑各个具体特质,然而很快的打上成绩,这样做费时不多,这就是“迅
捷”的含义。这种评分法可以对一篇作文作整体评分,也可以就文章各项目的不同特
点打出一系列的分数,既可以由教师评分,又可以让同学和写作者本人按照评分项目
标准标记上分数,故又有“多元评级法”的名称。

美国作文教学专家 M.A.特罗丝指出,教师评定、同学评定和自我评定的三种方
式的结合时逐步形成的。第一阶段:完全是教师评改起作用,它使学生了解写作的要
求是什么,怎样才算达到标准,评改作文怎样进行。第二阶段:学生将开始用教师评
改的观点和标准,尝试作些评改,其时不乏教师的必要指导和帮助;最后,学生才可
独立地自我评定和评定他人的作文。

M.A.特罗丝等人还编制了作文整体评价表和评定项目表。评价表中的“自我评
定”就是学生自己依据表上的项目按自己的主观意见给作文写上分数。“同学评定”,
由同组的学生参与评定,要求学生尽可能客观地给每个项目评定成绩。“教师评定”
即在前两种方式的基础上,作出总的评定。评分时机比较灵活,可以在起草初稿之后
评一次分(没有专栏);也可给修改过的文稿再评一次分;最后对作文全面的整体评
价,就放在誉清定稿之后。

(九)分析量表法
又称评定量表,它是分项评定作文的标准。分项评定由于分别规定了评分项目
及其各自在总分中的比重,所以比参照量表细致。杭州大学朱作仁教授等研究提出了
我国儿童作文能力的六项基本要素:(1)审题立意的能力——作文时能理解题意,紧扣
题旨写人记事,表达思想观点。(2)选材能力——选材切题、合理,观点正确,意义积
极。(3)确定详略能力——详略得当,该详则详,该略则略。(4)组织材料能力(条
理性)——层次分明,构段合理,过渡衔接自然,能有条理地表达。(5)语言表达能
力——语句通顺,用词正确,不写错别字,能用常用标点。(6)应用修辞手法的能力
——能使用常用修辞手法,增加语言的表现能力。

(三)作文综合测评方法论
从作文测评法的分类和几种评定法的简介可知:不同的作文测评方法各具特点
和适用性;在探索改进作文测评中,正逐步形成一个趋向,即向综合性作文测评方向
发展。这里所谓综合测评方法论,不能单纯地理解为一个具体的操作方法的掌握,而
首要的是,在思想上形成一种综合性的作文测评观,高屋建瓴,指导实践。
BCN3112 语文测验原理与实施

(一)综合性作文测验
现在使用的几种作文测验形式:客观题型测验、多段短文测验和全篇作文测验,
都具有其独特的长处和短处,它们之间的功能是互补的,理想的方法当然是三种作文
测验的综合。重要的测验应该综合多种测验形式,用一张试卷考核语文综合成绩。作
文测验常可采用以下几种形式:1)写普通作文,另写一、二段短文;2)写几段短文,
加答若干客观测验题(有时可结合阅读测验一起进行);3)写普通作文,加答若干客
观测验题等等。这样用增加考核量的方法来扩大测验范围,以提高评定的准确性。
作文测验对作文教学有反馈与导向作用。如果作文测验只用片断(不完整的短
文)或客观测验题,会导致忽视完整作文训练,冲击作文教学,最终影响学生作文能
力的提高。因此,纯粹的客观测验题形式的作文测验,只能偶尔用之,尽可能要与全
篇作文测验及短文测验结合进行。

(二)综合性作文评定
与综合测验相应,在评定学生作文成绩时,人们逐步形成一种“综合评定”的
方法论观念,其表现有四方面。
1.注意相对评定与绝对评定相结合。作文测评方法中的相对评定由于以鉴别学
生的个别差异为指导思想,成绩分布也以个别差异的实际分布作依据,使成绩测评实
现客观化,但它又无法指明学生的真正成就(多大程度上达到了教学目标),也无法
了解学生是否取得了在现有条件下所取得的最大成绩。教学中的绝对评定强调与教学
过程的统一,把掌握预定目标的信息及时反馈给师生,使他们主动地调控教学活动,
确保教学目标的达成。综合性作文评定的具体方式有:(1)首先把学生的作文,依水
平高低排列次序或分成若干等级(相对评定性质),在此基础上再依照事先拟定的标
准逐篇评分(绝对评定性质)。这可消除对比效应和先后效应所造成的评定偏差;同
时由于水平相当的作文排在一起以利比较,可使评分更精确。(2)首先按照评定标准
评分,然后把这一成绩转化为 Z 分数或 T 分数,也可转换为百分位数。
X X
Z=
S
T=50+10Z
100 R  50
PR(百分等级)=
N

公式中 X 为某学生得分, X 为全体学生平均数,S 为标准差,R 为原始分数在集体中


的次序,N 为学生总数。这样,学生的作文成绩即能反映达成教学目标的程度,又能
反映学生在集体中的地位。

2. 注意分项评定与整体评定相结合。首先进行分项评定,然后用整体评定法对
极个别作文再作适当的“整体调整”。如果各项表现好,真替效果欠佳,则扣分(占
满分数的 5-10%);各项目表现不很突出,但整体效果较好,则扣分(5-10%)。据我
们的研究,总分(百分制)在 80 分以上或 50 分以下者,不宜使用此法,否则会加重
不同评阅者评分不一致性的趋势。因为“整体调整”只在分项评定存在明显不足时进
BCN3112 语文测验原理与实施

行,要严格控制被调整者的比例,较好的消除评定的主观随意性,又能体现作文的整
体效果。
3. 注意形成性评定和总结性评定相结合。形成性评定在教学各阶段进行,目的
是发现教学中存在的问题,并采取措施及时克服。总结性评定在课程结束时进行,全
面了解教学目标的达成程度,给学生作出客观的全面评定。对普通作文的评定,最好
能采用分项评定法,以了解各种基本能力的发展情况,从而发现学生作文的困难和缺
陷所在,为补救教学、全面发展学生的作文能力提供依据。
4. 注意他人评定与自我评定相结合。依评定者的不同分类,作文评定可分教师
评定、学生评定与“多元评定”几种方式。其中学生评定包括“自评”和“互评”。
“多元评定”是教师评定、学生自评和互评综合的评定方式。学生自己参与作文评定
所得的结论,容易为本人所接受,避免可能出现的对立情绪,从而提高评定的实际效
果,同时对提高作文数学质量也起到良好的促进作用。它可使学生及时明确地了解自
己的进步,发现存在的问题,及时纠正失误;培养修改文章的能力,形成“自我检查
与评定”的良好学习策略;节省教师评定时间和精力,提高作文评价的实际效果,等
等。为使学生能有效地进行作文自评和互评,教师必须采取相应的措施,有意识地培
养学生的这种能力。

多元评定的具体做法:学生完成作文后进行自我评改,并将写作意图、材料来
源、构思经过等写成“后记”作为该篇作文的附录一并上交。教师浏览后随即发下。
在评议课上,先把每篇作文放在四人读议小组里交流;然后在教师的指导下,选出全
班有代表性的作文围绕写作要求开展讨论;接着学生相互批改,写评语、打分数,并
签上批改人姓名;最后交给老师评定。

c. 工具

I. 作文量表编制法

(壱) 作文参照量表编制方法
1. 参照量表编制的一般过程

其关键是为了找出一批能代表学生各类水平的作文样—样篇。量表两段的样篇要
分别能代表最优与最劣两类作文,中间的样篇不能遗漏有代表性的的几个等级。教师
对作文区分为 7 个等以上,所以用于一个年级参照量表等级一般是 5 直 7 个,以不超
过 7 个为宜。

编制作文参照量表一般有以下几个基本阶段:
(a) 收集样本材料。通过对学生被试的测验取得一系列的样篇背选材料。作文
题目要有代表性,学生被试必须是量表适用对象的全域的一个代表性样组。例子:各
地区,各类型的学校,男女学生,都应有适当的比例取样,否则会使样篇和常模资料
产生偏差。
BCN3112 语文测验原理与实施

(b) 专家评定。请三位以上有教学经验和有较高作文水平鉴别力的教师对样篇
作文评定成绩。常用的方法是首先对这些样篇作文按水平高低分组,然后再把各组的
作文依水平排列次序。这种方法对于使用于大样本有一定的困难。鉴此,也可使用分
项评定法评分。即先按“作文评定项目和等级特征”对各篇作文逐项评定等级,然后综
合这些等级数据作为作文的总分,最后排定次序。
(c) 统计处理。将个评阅者对每篇作文评定的分数相加,求得每篇作文的总平
均分数。
(d) 编排定型。 抽出每一等级内的一篇作文,作为某一等级的样篇;将每一等
级若干样篇依次排列,即成作文参照量表。最后进行质量检验。

2. 7 级作文参照量表编制步骤 (18 个步骤)


1.0 决定所要测量的作文能力,确定体裁,分析作文基本能力。
2.0 确定使用量表的对象或年龄范围。
3.0 编制测验:命题,同时规定测验的说明、格式及时间等。
4.0 预测和修改测验:(a)抽取学生样组试测,请教师试评,修改测验;用同样的方法再
测再评。(b)求前后成绩相关,据此修正测验时间、测验要求等,提高客观性与有效
性。
5.0 正式测验
6.0 将各年级的全部作文依照水平高低分为 A(最差),B,C,… J(最优)10 组。
7.0 把 A,B,C… J 每组再按水平高低分为 a(最差),b,c,d,e (最优)5 组(共计
50 组)。
8.0 对上述 50 组的作文,按水平高低,在各小组内排列次序。
9.0 调整不当的排列。
10.0 据各篇作文的等级次序记分,每组中最优者为 20 分,次之 19 分,…….
11.0 一此类推,登记在记录表内。

[以上 6.0 直 10.0 各步骤至少请三位评阅者独立去做]


12.0 求出各评阅者给每篇作文分数的总平均,再将作文从低分到高分顺次排列。
13.0 按照百分等级与 T 分数对照表(参考以下简表)所列出的百分等级,抽选出与这
些百分等级相应的 7 篇作文。

百分等级 0.50 5.0 25.0 60.0 88.0 98.5 99.0


T 分数 24.2 33.6 43.3 52.5 61.8 71.7 80.9

14.0 以 7 篇作文为依据,把各篇作文前后 5 篇作文抽取出来构成 7 组作文。每组各 11


篇。
15.0 请多位有作文鉴别力的评阅者独立评定 7 组中每组作文的成绩。每组作文中最劣者
得 1 分,最优者为 11 分。各组皆然。
16.0 计算每篇作文的平均得分。
17.0 抽取各组居中的作文,并注明它的 T 分数。
18.0 试评与质量分析。
BCN3112 语文测验原理与实施

以上是编制作文参照量表的程序,但又不是所有依次程序编制的量表都能评出
学生作文水平高低。它还受测验题目、主持者,以及评分者的知识能力等方面因素的
影响。

(弐) 写作分项测验和作文分析(评定)量表编制方法

下面对其中最必要的、目前作文量表编制过程中尚欠重视的几步工作略加讨论。
1. 测评项目的析定
a. 作文测评项目的一般要求。
根据分项作文评测的性质,确定作文测评项目要以作文基本能力的分析为基础。
每个测评项目反映作文能力的一个侧面,各项目构成一个完整的体系,这样就能全面
客观地反映出学生作文能力水平。

b. 确定测评项目的途径。(4 个途径)
分析作文教学目标。教育测量要求测评目标应该与教学目标相符,因此作为测
评项目可以通过分析教学目标的形式来确定,
调查研究学生作品。选取若干有代表性的学生作文,考察学生的作文情况,以
学生达到的实际水平为依据确定测评项目,使所设计的测评项目切近学生的实际状况。
概括总结专家意见和教师经验。一方面参阅已有文献中的有关专家们的理论研
究成果,概括作文能力的结构要素,通过对各种观点的综合、优化,确定测评项目;
另一方面通过证询专家和富有经验的教师的意见,为研究测评项目取得第一手资料,
然后参照前述文献,从而确定项目。
在概括出各种作文能力因素的基础上,合理运用统计测量方法,尤其是多元统
计法,使作文测评研究定量化,达到精密性水准。

2. 测评项目加权的确定 (3 个方法)

加权就是依据各项目的相对重要程度,分别给予不同的权数。确定作文项目加
权的方法主要有 3 个。
第一个是特尔斐法(Delphi technique),是由美国赫尔默,用来预测未来的直观法。
这种方法的步骤是:第一轮,首先请 10 直 15 名富有 10 年以上作文教学经验的语文教
师或作文理论研究专家各自提出作文测评应包括的项目;然后,概括出比较重要的一
些项目,再呈现给上述人员;主持者计算出每一项目的系数,平均估计值得偏差
(Δij)。第二轮,把第一轮表格中被调查者回答问题的情况反馈给被调查者本人,并让
提出项目偏差(Δij)最大的几个专家进一步讨论作出新的估计。特尔斐法的优点是:参
加咨询的人员不受权威影响,整个过程意见的收敛性保证了参加者能够取得一致的观
点,从而使加权能反映大多数人的观点。缺点是研究周期长,且要动员一定数量的专
家参加。

第二个是层次分析法,由美国学者萨蒂(T.L Saity)引入教育评价领域,是管理
学上的一种多目标多准则的决策方法。这种方法先把评价对象分解成不同项目,然后
采用两两比较的步骤,找出该系列可供选择的项目相对重要性程度的顺序,写成矩阵
BCN3112 语文测验原理与实施

的形式(称“倒数矩数”),从中推得一个加权系数向量—反映各个项目的相对重要性
程度。

第三个是因素分析法,是把分数的因素综合简化为少量的几个公因素,然后通
过各公因素在总变异中所占有的比值以及各变量的共同性来确定权数。这种方法可以
通过电子计算机对大量的数据做处理,所得结果比较精确,可以在一定程度上克服主
观随意性。

3. 评定标准体系的拟制

作文评定标准体系,就是评定学生作文的准则的具体规定。它最基本的由两部
分组成。
第一个是对各种程度作文的质量或特征的描述。这种描述对某篇作文而言相当
于“评语”,即狭义的标准。第二个是标号,即各种水平作文的标记符号,如
A,B,C,D,E,或 1,2,3,4,5,或直接记分。
标准体系的编制要遵循编制测评项目基本要求,概念一直,层次递进,通俗易
懂。各项目的评定标准要统一,共同构成相互协调的体系。
作文评定标准的显示,一般可采用 5 种方式即描述式、数字式、图示式、描述
图标式以及检核表式。
描述式(descriptive),用文字描述作文各个项目的不同等级的特征,指明符合什
么特征给多少(或等级),或者扣几分。
数字式(numerical),对作文评定标准不作具体的描述,只在标准前端写上数目,
并说明每个数目所表示的意义。
图示式(graphic),每个项目后划一条横线,并在上面划几根短纵线横线各交叉点
都标注适当的形容词或短语,代表不同水平的作文特征。
描述图表示(descriptive graphic),与特征图表式相似,区别在于对应地用描述性
的评语在表示等级的交叉点或相邻两点的“区段”上标志不同作文等级的特征。这种形
式综合了“描述式”的具体详尽(不易导致误解)和“图表式”的形象简明的优点。
检核表式(check lists),列出各种好的或差的特征。评分时,在全部项目中找出
与学生作文相符合的项目,用√号标记。然后根据各个项目所赋的分值。求平均数或总
和,作为最后分数。

II. 作文量表型式及实例

作文量表有三种型式:参照量表、分析量表和分项测验。它们在实际施用中各有
优点和弱点,所以人们在选用作文量表时应掌握其特征,有效地发挥其功能。

(壱) 参照量表的特点
BCN3112 语文测验原理与实施

参照量表符合作文测评有度而不精密、可量而不琐细的特点。但是,从测量工
具的有效性、可靠性、客观性、便利性等基本要求来看,作文参照量表尚难尽如人意 。
在应用中,它有五个缺点。
第一,由于作文水平有多种因素的影响,如内容方面包括思想、组织、用词,
形式方面包括造句、分段、标点等,不像图画、书法等作品有比较多的视觉形象,有
时阅读数遍才能领会其思想内容,所以一般教师评定仍有较大的主观随意性。
第二,在评分前得熟悉一系列样篇,仔细评分时要把作文与样篇逐一比较,所
以使用不十分便利,实际推广有一定的困难。
第三,样篇取样若少,很难找出相应的参照量样篇作为评分对照物,会造成实
际上的评分失控;反之,样篇若多,使用又受限制,不易区分不同的等级。
第四,样篇取样在文体方面也有限制。一套参照量表,难以同时适用于评定不
同文体的作文。
第五,由于评分笼统,所以缺乏诊断功能。
当然,我们也要肯定参照量表的优点。它是以学生实际完成的全篇作文为评定
对象,其效度是显然的。对有经验的的作文教师或受过训练的评定者,使用参照量表
还算简便,且省时间。参照量表提供的常模资料可作为相对评价的依据。在大多数情
况下,人们不必对作文作过细评价时,用参照量表评定十分合宜。

(弐) 分析量表的特点

分析量表又称为评定量表。分析量表是分项评定作文的标准。 分项评定由于
分别规定了评分项目及其各自在总分中的比重,然后再从各项的分数综合成总分,所
以它比参照量表细致。分析量表可让不同教师强调不同方面所造成的评分偏差得到较
好的平衡。

根据杭州大学朱作仁教授等研究提出了儿童写作能力的六项基本要素。一、审
题立意的能力。审题立意能力主要是看儿童是否在写作时能理解题意,紧扣题旨的写
人记事,表达自己的思想观点。二、选材能力。这能力主要针对看学生是否能做到选
材切题、合理、观点正确和意义积极。三、确定详略的能力。确定详略的能力主要考
查看学生是否做到在写作时能拿捏好详略得当,在该祥写的地方祥,在该省略的地方
略。四、组织材料的能力。组织材料的能力主要是看儿童在写作时能不能做到层次、
条理分明,构段合理,过渡衔接自然并且能有条理的表达想要表达的事物。五、语言
表达的能力。语言表达的能力主要考查儿童能正确的应用常用标点,做到语句通顺,
用词正确并不写错别字。六、应用修辞手法的能力。一篇好的作文应使用修辞手法,
因此这一项要素主要是考查儿童是否能使用常用修辞手法,增加语言的表现力。

使用分析量表有四个优点。第一、分析量表可在多种作文评定法中得到应用,
如分项评定法,整体评价法等。第二、其科学合理的作文评定标准的项目,也是编制
分项测验测验,也是参照量表的基础。第三、分析量表的评分有良好的诊断作用。第
四、若由有经验的教师或受过培训的评定者使用分析量表,将会有较高的效度和信度。

分析量表有优点当然也存在着缺点。使用分析量表的缺点是:一、使用分析量
表来评定极少数优秀作文和谐统一的风格和艺术感染力,是有局限性的。二、使用分
析量表时,教师对每一篇的作文都要做给若干等级或分数导致教师需花费较多的时间
来批改。因此使用分析量表将造成对需评定大批量的作文带来不便。三、由于受评定
者掌握与理解分析量表中评定指标差异性的影响,导致在评分中会出现一些“游离”标
BCN3112 语文测验原理与实施

准的现象。“游离”的现象会发生是因为就算分析量表上已详尽而具体的描述评定的指
标或项目。但因为每个人所拥有的认识水平不同,因此便造成了所谓的“游离”现象。

分析量表因依据不同,可分为两种。那就是以评定写作能力要素为主要的量表
和侧重于评价写作教学目的的量表。但最理想的模式是吸收两方面的合理因素的评定
量表。

分析量表的使用要则以“真是一个好主意”为题进行测验,建立了常模。它可使
用于跟该题目难度相当的作文测验的分数解释。当然,其他记叙文的命题作文也可用
此量表评分。作文限时于一个小时交卷。

分析量表的适用对象是小学毕业生。只要相应地提高或降低标准,也可用于其
他阶段的学生和具有初级作文水平的成人。分析量表对于测试以汉语为第二语言的学
生的初级作文水平也有一定的参考价值。

(作文分析量表实例可参考于《语文测验原理与实施法》朱作仁著, 第 361 页。)

(参) 分项测验量表

分项测验量表主要是把作文能力分析成若干基本因素,编制成相应的分项测
试题,借以综合评价学生作文能力的一种方法。分项测验量表的测验形式属于语言测
验中的“分立式测验”的范畴。拉多(Lado,R)认为,只要有代表性地有选择地对构成
语言的要素进行测验,便能准确的评定学生的语言水平。哈里斯(Harris.D) 也提出了
说只要对学生进行正字法、结构、词汇、速度与一般流利性测验,既能评定学生的写
作技能。
实际应用的分项测验可分成客观测验和多段短文测验这两种形式。
客观测验可以选择题、填空题等客观题型来评定学生的作文能力。如普莱塞
(Pressey)的作文诊断测验,分别使用大写、标点、文法和语句四种测验题推断学生
的写作能力。
多段短文测验又称为“分段写评法”,即根据不同目的,编制不同的题目,要求
学生写若干段文或片断、段落,借以评定学生的作文能力。例子: 第一题的要求是让
学生默读一篇短文。 读完后替它加上一个适当的题目。这是为了评定学生是否可以为
文章定适合的题目的测验。评分标准需依靠题目的要求、目的来拟定。所以在这一题
的评分标准可拟定为五个层次: 0 分, 学生没将答案写出; 1 分,所加的题目,和文
章的内容不合;2 分, 所加的题目,和文章的内容接近; 3 分, 所加的题目,把握文
章的重心;4 分, 所加的题目,正确完善等的评分标准。
使用分项测验量表的优点可分为三个。第一、每题作答或写作的时间短,题目
量大,覆盖面广。 如多段短文测验,从体裁方面,可让学生写记叙文、说明文、议论
文和说明文; 从写法方面有扩写、缩写、改写和等等;从结构方面看,可让学生写开
头、结尾和中间的主要段落。各种体裁形式的作文基本能力和表现手法可通过不同形
式的分项测验得到反映。 第二、使用分项测验量表可拟定比较详细的评定标准,提高
评分的信度。特别是在客观题的部分。 客观题的答案只有一个,对与错一目了然。所
以客观题的评定标准准确、客观、主观性偏差甚小,甚至可以用机器阅卷。 第三、使
用分项测验量表具有诊断的作用。一份项目完整而合理的作文分项测验,能分别测出
学生对于各种体裁的写作情况,测出学生作文的基本能力。
BCN3112 语文测验原理与实施

分项测验量表尚有指的进一步研究的地方。第一、那就是作文分项测验的项目
如何确定,各项目的分数权重又如何? 对于作文能力究竟包括哪些基本因素,以及各
种因素在作文能力中处于如何等的地位,人们的观点还是很不一致。所以,有必要用
统计的方法加以客观分析,从而保证分项测验的科学性。 第二、作文分项测验效度如
何?这个问题的争论颇多。反对意见的基本观点是因为各种作文能力的简单凑合,并
不等于作文的能力。 第三、是针对客观测验。反对者反对客观测验是因为他们认为客
观题是“全盘机械性的”,“不科学的”。
整体评价法是让教师、作者及同学分别对作文各项目进行迅捷的、有指导的
一种计分方法。 此“迅捷”和“指导”的含义是不对文章的某一部分作逐字逐句的做批改。
而是在阅读一篇文章少考虑后很快打上成绩评价全文得失,指出不足之处,为修改文
章提供建议。根据美国作文教学专家 M.A 特罗丝指出,这种教师评定、同学评定和自
我评定相结合的方法在操作时可分为三个阶段:第一阶段是由教师示范,是学生了解
写作的要求及批改方法; 第二个阶段则让学生尝试批改; 第三个阶段让学生独立自评
并评定他人的作文。
(整体评价法表用法:请参考《小学语文测验原理及实施方法》,董蓓菲编著;第
255-256 页)

本单元结束!

You might also like