You are on page 1of 21

蜃∷艹岌∷

丧∷ 应角
第 一章 教 学评 估理 念

Miller,hnn与 Gron1unK⒛ o9)认 为 ,评 价 (a$峦 s血 eno是 指经由观察、


表现与专题评定
或纸笔测验获得学生学习信息 ,并 对学生学习进展予以价值判 断 ;评 价要 回答的问题是 f这 个
人表现有多好 ?” ,兼 顾量化描述 (测 量 )与 质化 描述 (非 测量 )。 测 量 (m乩 血re” ent)是 获得量

化的过程 ,用 以描述个人拥有特殊特征的程度 ;测 量要 回答 的问题是 这个人表现有多少 ?” ,重
点在量化描述。坝刂 验 (test)是 指运用⊥种特定 的工具或系统化程序 (通 常包括-组 试题 ),在
固定时间与合理可比较的情境下对所有学生进行测验 ;坝 刂 “
验要 回答的问题是 无论是与个人或
他人表现比较 ,这 个人表现有多好 ?” ,重 点在个人或与他人表现的比较 。

测量(女 口测验 ) 非测量 (女 叫0正 式观 察 )评 量

价 值 判 断(如 良好 的学 习进展)

∷ 图 1-1 评价过程
(数 据 来 源 :MDˇ Ⅱ11er,R,L Linn&N.E.Gr° nlund,Measurement and
Assessment【 Fl Tcachng(10th ed.).Upper sa-dlc RⅡ er,NJ:Merrill,2009,p.29.)

AⅡ ⒍an(zO00)认 为 ,教 学评估 (asses.sment in teaching)是 指教师将所得的信息数据加以

选择、
组织和分析后对学生作决定或价值判断的过程 ,信 息乃教师在课堂上收集到的种种量或
质的信J崽 1
Wiggins(1998)认 为 ,评 价 (assessment)不 应只是 了解学生的表现 ,更 应教育与改善学 生
的表现。hnn与 Miller(2005)及 Millor,um与 Gr。 nlund【 2009)均 强调评价能提供学生 目
前的成就状态与进展 ,及 教育质量相关的信息 ;教 学评估 必须确认学生需要学习什么 (内 容标
准),并 决定何时应达成何种程度 的标准 (表 现标准 ),方 能 落实绩效责任 的标准本位评价。
虬rasian(l陇 9)指 出教师依据教学评估结果 ,来 实施行政 、
教学 、综合决策 :阝 行政决策 ″是指打
分数、 分组 、 评价进度 、 ”
解释考试结果 、与家长会谈 、评断需要特别安置或奖励学生 ;“ 教学决策
是指教∷ 师思考教什么 J日 何教 、 何时教 、
用何教材 、
课程如何进展以及活动设计如何依学生反应

而变化教学 ;“ 综合决策 是指了解学生学术 、 社交与行为特征 ,增 强班级教学 、 沟通与合作 ,及
建立与维持有效的班级气氛 。

观之两岸四地教学评估现况 ,未 来宜朝阝多元化教学评估”、人性化教学评估 ”、 “
精确化教
”“ ”
学评估 、统整化教学评估 等四个向度全力以赴。

第 -节 多元化教 学评估

纸笔测验虽然能测量认知领域的学习结果,但 在技能、
情意领域则有其先天限制,如 文章、

第 一幸 教 学评 估 理 念 1
图画、 实验报告 、自然科学展览设计 、 演讲 、 握笔 、 问题的形成 、
打字 、 想法的组织 、创意和小组合
作学 习能力等 ,均 难 以运 用纸笔 测验评 价
(Wolf,Bxby,α en⒏ Gardner,1991;um⒏
Miller,⒛ 05;Miller,hm⒏ Gronlund,⒛ Og)。 教师教学必须兼顾认知、 技能 、情意之学习
“ “ (实
结果 ,评 价不仅应分析 应该怎样表现 (知 识 )” 与 真正表现行为 作 )” 之间的差异 ,亦 应兼顾
“ ” “ ”
过程或程序效能 与 作业 表现作 品效能 ,方 能检讨教学成效与实施补救教 学 ,教 师宜善用
“ ”
多元评价 方能适切评价学生真正的各项学习表现 。
— 、多元 化 教 学评 估 的意 义

李坤崇 (1999,⒛ 01a,zO01b,⒛ 02a,⒛ 06)认 为 ,传 统 的以纸笔测验为 主的教学评估 ?具


有计分客观 、 批 阅迅速 、易于 团体施测 及激励学生认 知学 习等优点 ,且 能 充分发挥公平 、 客
观、省时 、省钱 的功能 。但 也衍 生 出下列 1z项 问题 :(1)评 价 目标较少顾及教 学 目标 ,形 成
教学与评价脱节 。(2)评 价 内涵过于偏重认知 ,较 忽略技能 、 情意 。(3)评 价方式过于偏重
(5)评
纸笔测验 ,轻 忽其他评 价方式 。(4)评 价时机过 于重视总结评价 ,较 忽略形成评价 。
(6)评 价结果解释过于强调缺失 ,较 少
价规划未能周延 ,未 能营造公平 、良好 的施测情境 。
(8)评 价认 知过于
增强学生 。(7)评 价结果解释过于依赖 量化测量 ,忽 略质化描述 。
鼓励 、
强调记Jlzi层 次 ,忽 略高层次 认 知 层次 。 (9)命 题 观念 与技术延续偏 差 习惯 ,仍 有待加 强 。
(10)测 验试题编排以教师为 中心 ,未 以学生为 中心 。 (1D评 分缺 乏客观标准 与 自省思维 ,

流于主观 。(12)家 长分数 至上观念难 以消 除 ,升 学 主义持续挂帅 。可见 ,传 统 的教学评估


与人性化 、多元化 的教学评估相去甚远 。
hnn与 Miller(2005)及 Mi11er,hnn与 Gr。 nlund(⒛ 09)均 强调评价过程包含各式各样
的程序 ,依 据其采用 的参考架构 ,可 将程序分类成许多不同的方式 ,有 关班级评价程序 的描述 ,

详见表 1∵ 1。
Lazear(1999)认 为 ,教 师实施多元教学的意愿高于多元评价 ,其 因有 二 :一 为教师较缺乏
多元评价经验与知能 ,实 施较不易获得家长与同学支持 ;二 为家长不 习惯看 自己与他人孩子的

分数 ,更 不习惯去分析与鉴定孩子的各项学 习与关键能力 。然而 ,身 为教师应当为所 当为
,而

非取决于个人意愿 。教师当务之急在于提升评价专业素养 ,而 非回避多元评价 。


张稚美 (200ω 提出通过纸笔测验 、 教师观察 0卩 真实或实作评价)1多 元智慧成长档案 的三
角检核法 ,来 评价学生成长历程与学业发展 ,且 此三项各 占学年成绩的三分之一 。纸笔测验用
来评价学 生认知层面的学 习结果 ;教 师观察指教师先系统建立评价知能与评价指标 ,再 对学生
” “ ” 情意层面的学 习结果 ;成 长档案评
实施有 目的的f观 察 与 记录 ,此 方式颇能评价学生技能 、
人评
价可完整呈现学生整个学 习历程 ,提 供学生 自我评价与习惯性省思的机会 ,若 再将家庭纳
(2000)虽 然发展 出系
价学生学 习与成长历程中 ,更 能为学生搭起学校与家庭 的桥梁。张稚美
列的评价方式与具体策略 ,颇 能兼顾纸笔测验 、 教师观察 、成长档案三种评价方式 ,然 而评价方
式与评价人员仍可更多元 ,且 评价内涵不一定局 限于多元智慧 。
Gardner(1993)从 不同的思考向度去看学生的学习成长 ,强 调未来评价将具有 下列特色 。
(D评 价 (as壶 ssment)重 于测验 (testing):通 常测验为几个 目的而实施 ,无 法确实反映 出外在
环境实际的需求 ,而 测量更可获得个人技能或潜能 ,提 供个人有效的回馈及外在环境有效 的信
息。(2)评 价乃教学历程中简单、自然发生的措施:评 价乃教学历程中的一部分,应 与简单、自

2 教学评估
表 1-1 班级评价程序的描述

最大 表 现 (乩 妊mum 决定个人“
能做 (can do)” 的最隹表现 ,即 个 人 性 向测验 、
成就测验
测本
验质

perfor【 naⅡ Θ 全力以赴时,能 做到的最佳表现。

典 型 表 现 (typical 决定个人在 自然状态下阝


会做 0逊 do)” 的表现 , 态度、兴趱 、
人格量表七
perf° rmance) 即强调个人具有代表性 的表现而爿F最 佳表现 。 观察技术 、
同学评价

技能的有效测量 ,乃 间接指标 ,即 学生从


知识、
固定选项测验 既有的选项中选择问题 的答案。如选择题 、 是
标准化选择题测验
(£ ixed-choice test)

蕙鞫 |
测验
形式 测量在情境脉络的表现和学生 自身正确评价
复杂表现评价 问题的表现,即 学生建构延展性屎应或响应复 实验 室 实作 、专 题 计
(complex perfo啷 论 文 式测验 、日头
杂作业。旨在改箐固定选项测~zn过 于强调事 划●
asse.ssment) 实知识与低层次技熊之失 凋分析学隼的复 报告
,强
杂表现。

准各 度 测 验、性 向测
安置评 价 (placement 决定先备技能、 课程 目标的精熟度及最佳学习
课程前测 、自陈量
验、
assessment) 状况 ,即 用之决定教学开始时的学生表现。
表、
观察技术

形成 评 价 (fomativρ 决定学习进展、 提供回馈以增强学习和更王学 教师 自编测验 、出版


之级学
用班教

assessment) 习镨误 ,即 用之宁教崇期间监控学习进度。 社测验、观察技术

诊 断评 价 (diag∞ stic
^,即 习困难的原因-忄 智、
决定持续性学 生罂)笮 已出版 的诊 断测 验 、
绪、环境 用之于教学期间诊断学习的 教师 自编诊 断测 验
assessment) `

困难 。 观察技术

分派等第 以决定课程结束时的成就或认证 目 教 师 自编 调 查 测 验 、
总结 评 价 (s-t帕 之评价 教学课 程 (或 单 表现评 分 量 表 、产 品
标达成的精熟度 ,即 用∷
assessment)
元)结 束时的成就 。 ∷ ∷ 量表

以定义清晰学习任务的明确范畴来描述学 生
标 准 参 照 测 验 教师 自编 测 验 、出版
表现(例 如个位数加法)。 解释依据清 晰定 义
锞解站

(c汪 ∞r0n referonced 社提供 的测 验、观察


或明确成就的范畴(标 准表现),强 调能不能达
test) 技术
成学习任务 。
标准化性 向测验和成
常模参照测验 (nom
refer0nced test)

堇肀鬈
纂糠爨 镬
嚷羲簧 就 ull验 、教 师 自编 调
查测验 、 兴趣量表 、 适
强调个体间的差异 。 ∷ ・
应量表

:Ⅵ D Miller,R△ Lhn&N。 E Grodund,卜 勿曰s勿 c鲰 9aJ@溯 刀 △ ∝ 屁 mg(10th


涠叼砣 犭
掺改 自
缸 ),Upper sa-d忆 Rver,NJ:Meroll,200g,p。 焖。 ^ssε


然的学习情境高度结合 ,而 非外加 。(3)评 价应具生态效度(e沆 logical valdty)|评 价宜在 真
实工作情境〃的相似状态下进行 ,方 能对个人的最终表现作出最佳的预测。(4)评 价工具应具
“ 原则:大 部分测验工具着重语文及逻辑—数学两种智能,然 此两种智慧较强者评价
智能公平”
结果通常亦较佳,工 具应顾及各种智能强势者。(5)利 用多元测量(measures)工 具:评 价宜采

第一 幸 扶 学评 估 理 念 J
取多元的测量工具 ,以 测出不同能力的各种面向。(6)顾 及个别差异 、
发展阶段及各种不 同的
专业知识 :评 价时宜考虑个体的个别差舁、
不同发展阶段以及不同专业知识所产生的评价结臬
的差异。(7)评 价素材趣昧化 :评 价应利用一些有趣及能引起 动机的素材 ,让 学生乐于进行 。
(8)以 学生利益为前提 :评 价 旨在帮助学生了解其学习优缺点 ,应
将评价信息回馈给学生。
田耐青 (1999)提 出 ,符 合多元智能理念的评价应具各下列五项原则 :(1)评
价长期化 :长 期
评价可对学生的作品或表现进行连续性的观察 ?并 可提供学生对学习作持续性的反省。(2)评
家长与学生。(3)评 价 回馈
价多元化 :评 价 内涵包含 内容和技巧的评价 ,评 价人员包括教师 、
教师及家长。(4)评 价兼顾非正式评价 :学
化 :评 价结果应该能为教学提供信息 ,田 馈予学生、
生在班级互 动的参与度与 日常表现 ,反 映的学习态度应 予兼顾 。(5)评 价激励主动的 自我评
价 :学 生有能力评价 自己学习的优缺点 ,能 清楚说出 自己学到的知识 或概念 ,更 能确认 自己应
如何运用适当的思考与学习历程 。
综 合 田 耐 青 (1999)、 李 坤 崇 (1999,zO01a,2001b,2oo2a)、 张 稚 美 (2000)、 Nrasian
(2000)、 Gardner(1993)、 Wo亻 ,Bixby,Glen上 手Gardner(1991)、 Linn与
Laze直 r(1999)、
Miller(20o5)及 Miller,hnn与 Gr。 nlund(2009)的 观 点 ,阐 述 多元 评 价 的意 义 ,多 元 评 价 是 以
教师教学与评价专业为基础 ,依 据教学 目标研拟适切的评价方式、
评价 内涵、
评价人员及评价
时机与过程 ,并 呈现多元的学习结果 ,以 提供更适性化的教学来增进学生成长 :

二 、多元 评 价 的迷 思

以李坤崇 (2002b)累 积 1996年 参与台湾高雄市开放教育改革 ,1998年 参与台南市教育改


革 ,⒛ 00年 起参与台湾九年∵贯课程改革 ,以 及 四度走访 25个 县市高中职、中小学研讨教育
与课程改革等经验 ,发 现中小学教师或行政人员对多元评价存在很多误 区 ,遂 提出下列正确
解读 。
(一 )多 元评价并 非废 除纸笔测验
有极少数教师认 为 ,实 施多元评价 ,即 废 除纸笔测验 。此 种思维乃极 端思维 、
谬误思
.

维 。实施多元评价乃因以往传统纸笔测验定于一尊 ,纸 笔测验几乎掩盖所 有评价方式 。然


而 ,实 施 多元评价乃基于适性化 、目标化的理念 ,不 仅让每位学生 的各种能力 均获得充分发
挥 ,不 限于纸笔书写能力 ;更 让各项教学 目标均得 以最适 当的评价方式 ,来 检核学生达成 目
标的程度 。
(二 )多 元 评价并 非一种评价
有甚少教师误将档案评价、 实作评价或系列实作评价 (游 戏化评价 )等 单一的评价方式视
为多元评价 ,此 乃谬误思维。多元评价顾名思义乃评价学生 的学习表现 ,使 用两种或两种以上
的评价方式 ,方 能称之。
(三 )多 元评价莫 为 多元而 多元
有些教师误以为没有实施多元评价就不叫课程改革 ,出 现颇多为多元评价而多元评价的
现象 。实施多元评价必须呼应评价 目标 ,依 据评价 目标选取最适切 的评价方式 ,陷 人纸笔测验
或多元评价的窠臼,均 非理想 。多元评价应考虑学生、
家长与教师的负担 ,若 过于复杂 t过 多时
间 ,将 使教师、
学生在评价时花费更多时间 ,而 排挤到教学 ,产 生过分重视评价而轻视教学 的乱
象。实施多元评价亦不应造成家长困扰 ,顾 及家长家庭背景、
时间 ,避 免对家长造成不必要 的

4 教学评估
负担 =因 此 ,教 师设计多元评价应以简易可行为原则 。
(四 )多 元评价并非 目的
有极少数教师将多元评价视为 目的 ,一 味地盲从附和 ,而 忽略多元评价实乃了解学生学 习
斌效的工具 ,是 手段而非 目的。教师应秉持专业素养 ,考 虑教学 目标 ,善 用最适切 的评价方式
丧贲量学生的学习成果。
(五 )多 元评价并非学 习终 点
两岸四地有些教师或家长将评价视为学 习的终点 ,仅 作为奖惩的依据 ,而 未深究其学 习得
走.更 未提出补救或增强措施 。教师实施教学评估并菲是学 习的终点 ,而 是另一个更适性化学
习的起点。实施多元评价觉察学生在各种学 习内涵的成果后 ,应 提出适性的教学策略 ,激 发学
兰潜能与补救学生的学习缺失 。
(六 )多 元评价并非主观评 价
实作评价 、
多元评价常用纸笔测验 、 轶事记录 、口语评价 、
档案评价、 系列实作评价 (游 戏评
扯)、 动态评价等多种评价方式 ,除 纸笔测验的主观性较少受质疑外 ,颇 多人误以为其他评价方
式乃主观的评价。其实严谨的实作评价 、 轶事记录 、口语评价 、档案评价、系列实作评价 (游 戏
诨价)及 动态评价 ,通 常会拟定评分标准作为计分依据 ,尽 量减少人为的主观干扰。因此 ,多 元
评价未必主观 ,一 份详列评分标准 的非纸笔评价 ,评 分仍相当客观。
(七 )多 元评价并非万 灵丹
多元评价虽可避免单一纸笔测验之失 ,但 多元评价并非万灵丹 ,仍 有其先天的限制 ,如 增
加工作负担 、 教师应不断充实与提升 自己的评价专业素养外 ,持 续研发各种符
经费负担。除了∷
合教学 目标的多元评价方式外 ,教 师亦应获得学校行政 、家长 、
社会大众的支持 ,不 断尝试与修
正 .共 同面对挫折与度过调适期 ,方 能落实多元评价理念 。

三 、多元 化 教 学评 估 的特 质

参考上述多元化教学评估的意义与解读 ,多 元化教学评估必须具各下列特质 。
(一 )专 业 多元
多元评价的专业素养 ,不 仅应具学科专业素养与掌握教学 目标 ,更 应包括教学专业素养 、
评价专业素养 。李坤崇 (1999,⒛ 01b)认 为 ,达 到评价专业化 、目标化地位 ,教 学评估 宜加强下
刭八项重点 :(1)掌 握教学 目标 :清 晰明确地掌握欲评价科 目单元的教学 目标。(2)专 业判断知
” “ ”
髭 :有 些教师质疑一般出版社提供 的阝习作 或 教学评估单 不完全切合班级学生 ,因 无一套评
价工具适用于所有学生 ,而 补救之道在于教师能否 以评价专业素养来分析 目前普遍运用的各
评析是否适用于班级学生 ,了 解现成评价工具是否需稍作修改 以切合班级
项评价工具的优劣、
学生。(3)兼 顾技能与情意的评价 :评 价不应限于低层次的认知 ,而 应顾及技能与情意的评价 、
高层次的认知。(4)剖 析教材 内容 :逐 一剖析教材单元 的重心 ,了 解学生可能 的学 习问题。
教材内容设计完善的双向细 目表。(6)规 划评价方式或慎选题
(5)设 计细 目表 :依 据教学 目标、

目类型 :采 取适切的评价方式 ,如 行为检核表 、 观察报告 ;若 采取纸笔测验 ,宜 依据


态度评价表、
认知领域教学 目标的层次慎选题 目类型。(7)善 用命题技术 :命 题必须符合命题原则 ,充 分善
EE命 题技术来适切呈现学生的学 习结果。(8)适 切解释评价结果 :有 些教师解释评价结果时 ,

悲观的处事心态 。
对学生实施不必要的分类或贴标签 ,使 学生遭受挫折 ,产 生负 向 自我观念 、

第一章 教 学评 估理 念 f
因此 ,教 师必须适切解释评价结果 ,让 学生能从失败中成长 ,能 从挫折中重生。
(二 )内 涵 多元
教师实施教学评估时 ,评 价 内涵至少包括认知、 情意、技能等领域 内涵 (Ⅱ nn⒏ Miller,
2005;Miller,Linn&Gr。 nlund,2oo9),展 现评价内涵生活化、 多样化 。以往学生考试只要抱
“ ”
着教科书死背 ,当 个 贝多芬 (背 多分)就 可得高分 ,乃 传统教学评估内容多以教科书中认知层
面的记忆、 理解能力为主 ,较 少顾及 技能与情意、 认知层面之 高层次思考能力 ,或 生活化的题
材。李坤崇 (199ω 认为 ,推 动教育改革除考虑认知、 技能、情意外 ,尚 需兼顾学生的学 习历程 、
“ ”
生活世界与社会行为。 学习过程 包括学生的学习方法、习惯 ,求 知历程或解决问题的能力 :,

学生以往限于书本记忆而疏于应用 ,且 家长过度保护剥夺学生成长机会 ,使 得学生 自我解决问



题的能力欠佳 ,故 学习历程应被纳人评价之 中。 生活世界 ”乃学生 日常行为、 待人处事能力 ,

或许有人会说现今教育培养一群躲在象牙塔里的书呆子 ,缺 乏走人人群的待人处事能力 ,若 纳
人评价将可引导学生注重此方面的学习。“社会行为”乃学生人际关系的社会行为或社交技
巧 ,时 下学生常拙于J清 感表达或社交技巧 ,导 致此类犯罪事件层 出不穷。可见 ,教 师宜透过评
价来强化学生的社会行为 (李 坤崇 ,1999)。 |

九年⊥贯课程基本理念在于养成学生 终身学习”的能力 ,而传统教学评估通知单 的制作
ˉ
认知阶段 ,若 未能突破将难以达成九年 贯课程基本理念 :教 师为激发学生 自主
停留于抄写、
学习与培养终身学习的能力 ,通 知单宜特别着重学 习过程的导引 ,设 计通知单掌握 四大重点 :

(D告 知学习 目标 。(2)引 导学习过程。(3)告 知评价童 。(4)记 录评价结果 。另外 ,实 施九


`点
年一贯课程之多元评价内涵 ,宜 将各阶段能力指标进行细项 (概 念分析结果),再 分析能力指标
细项与认知 1技 能 、 情意的关系程度 ,最 后决定评价 内涵。分析能力指标细项与认知 、 技能 、 情
“ “
意的关系程度时 ,认 知层次着重 知识理解”、思考批判”,技 能层次着重“ ”
技能表现 ,态 度层次
“ ”
着重 意愿态度 。然而实际学习活动评价 内涵 ,仍 视各能力指标细项 内涵不 同而不 同 (李 坤
崇 ,zO010。

评价内涵亦可纳人 Gardher的 多元智能理论 ″(muhpk intelligence theory)。 Gardner
(1999)将 智能 (intelligencΘ 定义为“个体处理信息的生理、 心理潜能 ,此 潜能可用之解决问题
或创作某种文化环境的重要作品 。这里强调个体的主动性及文化价值。他对 “
″ ”
智能 抱持的
基本理念为 :第 工 ,智 能并非与生俱来就是 固定或静态的。第 二 ,智 能可教 、 可学、 可提升。第
三 ,智 能乃多向度的现象 ,展 现于大脑、 身体等系统的多种层次 :
心灵 、 ∷
Gardner(1999)强 调 人 类 智 能 至 少 包 含 下 列 八 项 半 智 能 :语 文 智 能 (lihguistic
逻辑一数学智能 (logical亠 mathem直 tical intelligence)、 肢体⊥ 动觉智 能 (bodil疒
intellig0ncΘ 、

knesthetic intelligence)、 音乐智能 (musical intelligence)、 空间智能 (spatial ht。 lligence)、 自然


观察 者 智 能 (naturaliot intelligence)、 人 际 智 能 (intcrpersonal intelhgence)、 内 省 智 能
(intrapersonahntelligencΘ ,及 半项智能—— 存在智能 (eⅡ stential intelligenc。 )。 上述 半
智能的具体含义如下 :
``项
(D语 文智能。是指能有 效利用 口头语言 (如 :讲 故事者 、演说家 1政 治家 )或 书写文字
(如 :作 家、
诗人 、 编剧等)的 能力 ,即 对语言文字之意义 (活 意能力 )i规 则 (语 法能力 ),以
记者、
及声音、 节奏 、
音调、诗韵 (音 韵学能力)、 不同功能 (语 言的实用能力 )的 敏感性 。

(2)逻 辑 数学智能。是指能有效运用数字和推理能力 ,包 含对逻辑或数字形态认知能

扶学评估
力和高灵敏度 ;具 有处理复杂前因后果的推理能力 ,及 巧妙地处理抽象分析的能力 。
(3)肢 体一 动觉智能。是指运用身体来表达想法与感觉 ,以 及运用双手生产或改造事物
趵能力 ,其 核心成分包括巧妙地处理 (包 括粗略与精致的身体动作 )物 体的能力 ,巧 妙地使用不
同的身体动作来运作或表达的能力。
(4)音 乐智能。能察觉、
辨别 、
改变和表达音乐的能力 ;能 创作并欣赏旋律 、
音节和音质的
能力 ,即 人对声音的意义加以创造、
沟通与理解 ,主 要包括对节奏 、
音调或旋律、
音色的敏感性。
(5)空 间智能。是指对视觉性或空间性的信息之知觉能力 ,以 及把所知觉到的加 以表现
虫来的能力。包含对色彩、 线条 、
形状、
形式、空间及彼此间关系的敏感性 ,其 中还包含将视觉
而空间的想法在脑海中立体化及在一个空间矩阵中能很快找出方向的能力。
(6)自 然观察者智能。是指观察 自然界各种形态 ,辨 认并分类物体 ,洞 悉 自然或人造系
巯 .以 及链接生命组织的能力 。其核心乃经由五官观察 ,以 觉察 、
感受与省思的能力 。
(7)人 际智能。是指辨识与了解他人的感觉 、
信念与意向的能力 ,其 核心成分包括注意并
区辨他人的心情 √眭情、
动机与意向 ,并 作出适当反应的能力 。包含对脸部的表情 、
声音和动作
薮敏感度 ,辨 别不同人际关系的暗示 ,对 暗示作出适∷
当反应的能力 ,以 及拥有同理心的能力和
羡现行为。
(8)内 省智能。是指能对 自我进行省察 、区辨 自我的感觉 ,并 产生适 当行动的能力 ,并 能
茳复杂的情绪中区辨喜怒哀乐和 自我定位 、自律 、自知及 自尊的能力 ,此 种智慧也扮演着“ 智慧
中抠的角色”,使 个体能知道 自己的能力 ,并 了解如何有效发挥这些能力 。其核心成分为发展
可靠的自我运作模式 ,以 了解 自己 的欲求 、目标 、
焦虑与优缺点 ,并 藉 以引导 自己的行为之
髓力。
(9)存 在智能 :是 指“对生命议题的终极关怀”,包 含下列两项核心能力 :一 是在浩瀚宇宙
中.定 位 自己的能力 ;二 是处理存在相关问题 的能力 ,如 寻找生命 的重要性、
认识死亡的意义、
噬察身心世界发展脉络的能力 占
Gardner的 “多元智能理论”
渐受国际重视 ,且 广泛用之课程、
教学与评价 ,教 师实施评价
时可适切运用此理论 。
(三 )过 程 多元
LInn与 Miller(2005)及 Miller,Linn与 Gronlund(⒛ 09)强 调 ,评 价过程应顾及安置评
册、
形成评价、诊断评价和J总 结评价。评价不仅是预测学生未来发展、
评定学习成果 ,更 要协助
孛生在教学历程中获得最好的学习。有些教师应调整仅重视教学后实施总结评价的做法 ,宜
漩渐采取形成评价 ,将 评价纳人教学 ,亦 以评价结果作为改善教学的依据 。虽然形成评价渐受
漩 重视 ,但 并非否定安置评价 、
lMˉ
总结评价的价值 ,因 为一个完整的评价历程包括安
诊断评价、
蛩砰价、 总结评价 (李 坤崇 ,19哓 )。
诊断评价与、
形成评价 、
(四 )时 机 多元
评价时机包括定期评价 、
平时评价 ,小 学阶段一学期通常实施两至三次的定期评价。中学
叹多学校采用考试科 目集中考试方式 ,小 学则约有半数学校采用随堂考试方式 。利弊得失难
拟沦断 ,决 定什么方式应充分考虑学校愿景、教师素养 、
学生特质、
家长需求等因素。倘若教育
行政机关并未规定平时评价次数 ,则 应依各学习领域性质不同而异 ,通 常由授课教师依其专业
刹断、
学校沿革 、
家长要求 、
学生特质等来决定 。

第一章 教 学评估理念
(五 )情 境 多元
评价情境包括教室、 教室外情境。以往评价情境限于教室 ,纸 笔测验一般均于教室实施 。
轶事记录、口语评价、
随着评价方式的多元化 ,实 作评价 、 档案评价、游戏评价 以及动态评价等
评价方式 ,常 跳脱教室情境 ,在 教室外实施 。决定评价情境应依据评价 目标 、
评价 内涵 以及评
价方式等因素权衡 ,不 宜为室外而室外 ,亦 不宜仅限于教室内。若在教室外实施 ,通 常学生遭
遇安全问题较教室内为多 ,教 师宜审慎规划评价内涵与历程 ,免 于学生发生意外。
(六 )方 式 多元
“ ”
多元化教学评估的多种特质中,以 方式多元 最重要 。我 国台湾地区的做法与经验是 ,评
价方式应视学生身心发展及个别差异 ,依 各学习领域内容及活动性质 ,采 取笔试 、口试 、
表演 、
实作 、 作业 (报 告、 数据搜集整理 、 鉴赏、晤谈 、 实践等适 当之多元评价方式 。Linn与 Miller
(2005)及 Miller,Linn与 Gronlund(~9oo9)认 为 -测 验形式包括 固定选项测验 和复杂表现
评价。
评价不限于单一 的客观纸笔测验 ,评 价方式至少包括纸笔测验 (笔 试 )、 实作评价 (表 演 、

作、
作业 、 (实 (游 (资
鉴赏 践 )、 系列实作评价 戏化评价 )、 档案评价 料搜集整理 、 书面报告 )、 口语
评价 (口 试 、口头报告 、
晤谈 )、 轶事记录 、
动态评价等七项 ,显 现评价方式的多元化和弹性化。
(七 )人 员多元
我国台湾地区的f中 小学学生成绩评价准则〃中规定 :f中 小学学生的成绩评价 ・…得视实 ?・


际需要参酌学生 自评 、 互评办理。此规定较有前瞻意识地纳人 自评 、 同学间的互相评价 ,但 可
惜未纳人家长。评定学生学习成果的评价人员 ,应 可包括教师 、 同学、学生 自己、 家长等。
李坤崇 (1gg8,1999)强 调参与教学评估人员除多元化外 ,更 需互动化 ;因 为只有经由教师 、
家长 1学 生、
同学的充分沟通与讨论 ,才 能更清楚了解学生的学习历程与结果 ,挖 掘学生学习问
“ ”
题并及时施予补救教学。尤其是现阶段的教育 强化亲子互动、 鼓励家长参与 是当务之急 ,推
动教育改革若无家长参与 ,系 列实作评价 (游 戏化评价)、 档案评价或其他多元评价将因教师负
担沉重而难以实施。
)计 分 多元
(`、
“ ”“
评价的计分方式包括 直接给单一学 习总分 、经 由基本分数与加权分 数合计 而得单
” “ ” “
一学习总分 。工般教师较常采用 直接给单一学习总分 ,这 里不再赘述 。对于 基本分数

与加权分数合计而得单 学 习总分 ,在 个别学 习时 ,教 师为鼓励学生参与学 习历程 ,先 给

予基本分数 ,再 视其学习历程与结果给予加权分数 ,两 者合为个别学习的分数 ;在 小组合作
学习时 ,基 本分数常为小组 的分数 ,而 加权分数则为组 内个人 的表现分数或组 内人员 互 评
所得的分数 。 J

九年义务教育阶段强调培养学生f发 展尊重他人、
关怀社会 、
增进团队合作 的基本能力 ,

“ ”
高中阶段课程着重学生 增进团队合作与民主法治的精神及赍任心 。总之 ,在 中小学阶段 ,小
组合作学习被广泛运用。以下分成小组基本分数 、
组员加权分数两项说明。
1.小 组基本分数
小组合作学习的小组基本分数可由老师直接评分 ,亦 可由老师和各组学生代 表共同针对
各小组的表现和作品 ,来 评定各组基本分数 ,为 避免秩序紊乱与计 分困难 ,不 宜 由全班学生当
评审。若 由老师和各组学生代表共同评分 ,先 将所有评分者评定的分数加总 :再 依照各组 J总 分

8 敬孛评估
蝴高低排出各组名次 ,最 后 由老师依照各组的排名前后 ,及 考虑其他 因素 ,决 定各小组的基本

抄刂廴。
臼 ∷
2.纽 员加权分数
小纽合作学习的组员加权分数 ,可 由老师直接评分 ,也 可由学生 自评、
互评 的结果来推算 。
dfE纽 内自评、互评的结果来推算加权分数 ,先 将组 内全体组员 的评定分数加总 ,再 依照每
洫纽员所得总分的高低排定组内组员名次 ,最 后老师依照组 内每位组员的排名 ,及 考虑其他因
素.决 定组内组员的加权分数 。
(九 )结 果呈现 多元化
hm与 Millor(2oo5)及 Mi11er,Linn与 Gr。 nlund(⒛ 09)认 为 ,评 价结果的解释方法有标
破参照评价 、
常模参照评价 ,此 两种评价可视为一连续 体 的两端 ,而 非截然划分 ,可 兼采用
两种解 释方法 。除标准参照评价 、
常模参照评价外 ,亦 可纳人 自我参照评价 。教 师呈现评
鼢结果宜多元化 、
适时化 、
全人化 ,多 数教师呈现评价结果 时 ,仅 呈现 团体相对 位置 的常模
参照分数或呈现及格与否的标准参照分数 ,而 忽略 自我 比较 的努力分数 、
仅呈现学业成绩
未提供人格成长 ,亦 未适时提供学 习进步或恶 化状况 ,致 学生频遭挫 折或丧失立 即补救 时
飙。因此 ,教 学评估结果之呈现宜多元 化 、
全人化 、
适 时 化 ,如 兼采 能力 、
努力 的结果双轨

嗣 ,改 善学习通知单 。
两岸 四地学业能力较低的学生常须面对永无休止的挫折 ,因 其再怎么努力仍是班上学业
溅绩的后段 ,教 师呈现评价结果应兼采 自我比较 、 常模参照或标准参照的方式 ,女 Ⅱ 批阅学生作
“ 60或 95” ” “ ” “95”
业时可打 甲 丁 ,“ 、
甲 丁 指全班作业 的高低位置 ,“ 60” 、 指学生的努力分数 。
(1999)提 ”(详
李坤崇 出铕邕力、
努力兼顾之各项符号与评语 见表 1-2),这 种方法兼顾能力、

力的结果 ,可 供教师参考 。

表 1=2 能力、
努力兼顾之各项符号与评语

答案 的正确或 内容 的完 整

答案完全正确 ,或 完全符合老师的要求 ,而 且 比其他 同学有创意 ,或 做得


○ (A) 很好
更好 。

ˇ/(B) 不错 答案完全正确 ,或 完全符合老师的要求 。


z仑 \(C) 加油 答案部分正确 ,或 有一部分没有符合老师的要求 。
?(D) 改进 答案内容完全错误 ,或 完全不符合老师的要求。
× (E) 补做 (交 ) 未作答 或未交 。

努力 的程度

+ 代表你 比以前用心或进步。
进步 (“ +”
号越多代表越用心、
越进步 )

代表你 比以前不用心或退步。
退步 (“ —

号越多代表越不用心 、
越退步 )

第一章 教孛评估瑗舍 W
, 第二节 人性化教学评估

教学评估不应只是着重评价学生的学习表现,更 应在评价过程与结果中充分展现人性化
理念 ,方 能让学生获得激励、
尊重与支持。

-、 人 性化教学评估 的意义

人性化教学评估的意义在于以学生为申心的评价观 ,教 师设身处地地站在学生角度思考

研拟各项评价措施 ,重 视学生应有权益 ,不 因学生扮演 被评价” 角色而剥夺其权益。
“ ”“ ” ” “
人性化教学评估宜掌握 尊重 、个别差异 、 f适 性发展 三理念。 尊重?乃 将学生视为应
“ ” “ ”
被尊重的 人 ,尊 重其存在 ,更 尊重其想法。 个别差异 乃允许 、 重视并适切处理学生间的个

别差异 ,不 宜以统一的标准 、统 的规定来要求所有学生。 适性发展”
⊥ 乃确认崇生是发展中的
个体 ,有 其发展阶段与任务 ,教 师评价不仅应尊重其发展阶段与任务 ,更 应接纳发展的危机与
挫折。

二 、人 性化教学评 估的 特渍

欲激励学生正向思考 ,提 升正向自我概念 ,人 性化教学评估具有下列特质。
(∵ )评 价 中心学生化
教师从研拟评价目标、拟定评价计划、 实施教学评估、呈现评价结果到进行评价解释 ,由 传
统的以教师为中心的思维转换到以学生为中心 ,教 师设身处地地站在学生角度来崽考评价问
“ “
题。研拟评价 目标宜从学生角度来叙述 ,如 将 学生能描述 自己及相关人事物了解”
改为 能描

述 自己及相关人事物了解 。拟定评价计划宜让学生了解整学期评价的全貌 ,让 学生知道如何
做将可能获得怎样的评价结果 ,不 宜模糊评价的历程与结果。实施教学评估宜善用各种适切
的评价方式来衡量学生的学习表现 ,不 宜为纸笔测验而纸笔测验 ,亦 不宜为多元评价而多元评
价。呈现评价结果宜着重真实、 多元呈现学生表现 ,不 宜误判 、
片段呈现。解释评价结果宜着
重鼓励 、
支持学生 ,不 宜指责、
诋毁学生。
(二 )教 学评估计划化
有些教师实施教学评估不按计划实施 ,随 兴为之。缺乏评价计划不仅让教师教学评估缺
多元性与阶段性 ,更 让学生面对评价无所适从 ,如 不知整学期考试几次?何 时考试9
乏整体性 、
配分如何?除 了纸笔测验外 ,出 席率的配分 ,其 他评价方式的内涵、时机与配分 ,学 生均应有知∷
情的权利。因此 ,从 人性化考虑 ,教 师应拟定周延的学期评价计划 ,告 知学生 ,并 按计划实施教∷
学评估。
(三 )评 价 内涵同理 化 ・

教师编拟评价工具应以同理心的角度编拟 ,掌 握 己所不欲 ,勿 施于人”的理念来编拟评价
工具 。教师 自编测验时 ,试 题指导语的明确化 ,试 题编排由易而难 ,题 目内涵的明确化 ,计 分标
准的公开化 ,均 是人性化的基本要求。如有工教师命题为 :“ 香蕉是什么颜色F教 师依据课本

呈现的颜色 黄色” 作为标准答案 ,但 有些学生回答绿色、 棕色或黑色亦应给分 ,因 香蕉成熟度
不同颜色亦不同,故 教师给分应均予计分 。

f rJ 教学讦估
(四 )结 果呈现增 强化
分数是学生信心的来源 ,教 师评分应打出学生信心 ,而 非予以摧残。教师评分应有各式各
蔽窍一百分 ,如 扫地一百分、
服务同学一百分 、
上课专心一百分 ,不 让一百分窄化于语数外理化
等学科评价。教师评分应顾及个别差异 ,优 等生默写对 30个 英文生字一百分 ,而 程度较差者
觥写对 10个 就可给一百分 ,学 生的资质不同 ,为 何要求一致的标准 ?教 师呈现学生成绩时 ,应
t9颐 及学生的个别差异、努力情形 、进步状况 ,给 予学生增强、提升学习的信心 :

(五 )结 果解释正 向化
有些教师解释评价结果时 ,偏 向悲观化 、
负向化、
责备化 ,使 学生遭受甚 多挫折 ,教 师应多
臌励、
多支持学生 ,方 能增进学生正向自我概念 ,强 化其 自信心。结果解释涉及看问题 的角度 ,

亩些人习惯从一百分往下看 ,有 些人则从零分往上看 ,前 者只看未满 的部分 ,当 然悲观负向,后


耆看到努力的部分 ,当 然积极正向。教师若能从零分往上看学生表现 ,必 然充满着欣 喜 ,衷 心
储美学生 ;若 从一百分往下看 ,必 然充满着失望 ,时 时指责学生 ,因 此 ,评 价结果解释只在教 师
一怠之间。
解释学习结果不应局限于认知 ,应 兼顾技能与情意的阐述 ,有 些学生可能认知较差 ,但 其
敢滏、
情意颇佳 ,因 此 ,教 师可尽量挖掘学生优点予以强化 。
人性化 的结果解释除了兼顾常模参照或标准参照外 ,更 强调 自我参照 ,以 引导学生 自我比
镟、
自我进步、自我实现。

第三节 精确化教 学评估

随着教学评估多元化、 人性化 ,有 人开始质疑评价主观化、


笼统化 ,可 见 ,欲 提升教学评估
鹦信芰与效度 ,教 学评估宜迈向精确化。
—、
精确化 教学评 估 的意义

精确化教学评估 旨在强调测验编制历程 、 编拟题 目、


题 目分析与结果解释 ,呈 现标准化、 通
唧叱、贡量化与定锚化 ,提 升评价结果的信度与效度。若教学评估能兼顾多元化、 人性化时 ,更
黼具精确化 ,则 评价结果将更具有说服力。
由于计算机与网络技术的快速发展 ,题 目分析与测验结果更为快速 ,庞 大数据的处理时间
兀崛缩短 ,建 立题库更为容易 ,教 师个人资料的流通也更为便捷 ,使 得教学评估 日益精确化。

二 、精确化教 学评估 的特质

欲提升教学评估的信度与效度 ,精 确化教学评估宜具备下列特质。
(一 )编 制过程标准化
教学评估常用的各类评价方式 ,如 纸笔测验、
实作评价、档案评价 ,均 有其严谨、标准化的
犏颟过程。教师 自编纸笔成就测验通常包括决定测验 目的、
设计双向细 目表、 决定试题类型与
题数、
编拟测验试题、
审查与修改测验试题及编辑测验试题六步骤 ,教 师若能遵循 当可提高信
燹孑效度。

第一章 教 孛评 咭理 念
(二 )题 目编拟通则化
教师编拟教学评估的题 目,应 遵循各类评价方式的题 目编拟原则 。适 用于各类评价方式
的题 目编拟原则有 :(1)试 题分布依据双向细 目表 ,且 题 目内容依据有代表性。(2)避 免使
'`项
用暧昧不明和易使人混淆的言词或语句架构。(3)叙 述扼要 、 直接切人重点 。(4)使 用词汇适
合受试者 。(5)试 题答案必须是公认的正确答案 ,避 免争议性 。(6)表 达清楚 ,让 学生易于了解
其任务或工作 。(7)每 个试题必须独立存在 ,内 容不宜相互重叠 。(8)不 要提供正确答案 的
线索。
(三 )题 目分析质量化

题 目的优劣不能全由主观认定 ,宜 兼顾质的分析与量的分析 。 质的分析”重点为分析双
向细 目表 ,分 析题 目内涵与所属细 目表细格的一致性 ,分 析题 目质量是否合乎命题原则 ,分 析

编制过程的严谨性。f量 的分析 分传统题 目分析 (含 常模参照测验题 目分析 、 标准参照测验题
目分析)与 试题反应理论 (IRT)题 目分析。以常模参照测验题 目分析而言 ,主 要分为难度分析
和鉴别度分析 ,其 中难度有 三 种算法 :(1)计 算全体受试通过或答对某题上通过 的百分 比。
(2)计 算高分组与低分组在某一试题上通过的百分 比。(3)计 算 △(deltD难 度指数 ;鉴 别度可

从 内部一致性 、
外在效度分析。可见 ,教 学评估的题 目分析已逐渐迈向质量化 。
(四 )结 果解释 定锚化
教学评估的方式逐渐多元化之后 ,有 些被批评等过于主观的评价方式 ,已 逐渐发展出定锚
评分 (anchor score)或 定锚评等的策略。台湾地区教育主管部门于 ⒛06年 在当地 中学学生基
本学力的测验中试加考写作测验 ,其 评分方式采级分制 ,将 学生写作能力由劣至优共区分为-
至六等级 ,其 评分标准如附表 1-3;另 针对离题 、
重抄题 目及缺考等考生 ,因 无法判断其写作
能力 ,给 予其 0级 分 。可见 ,加 考的写作测验宜采用定锚评等的方式。

第 四节 统整化教 学评估

以往教学评估只局限于评价 ,未 能与课程 、
教材 、
教学相结合 ,未 来的发展趋势便是这 四者
的充分统整 。

-、 统 整化 教 学评 估 的意 义

统整化教学评估 旨在着重教师实施教学评估时 ,宜 统整课程 、


教材与教学 ,让 四者环环相
扣。课程引领整体的计划 、目标 、
教材与教学 ,教 材乃教学的工具 ,教 学乃引导学生学习的艺
术 ,评 价乃检核学生达成预期 目标的程度与引领学生成长 ,若 四者能 紧密统整 ,则 教师教学与
学生学习成效将可提升 。

二 、统 整化 教 学评 估 的特 质

随着基础教育课程改革的进一步深人 ,统 整理念逐渐萌芽 ,中 小学教育现场已逐渐重视课


教材 、
程、 教学与评价的统整 ,具 体的特质如下。
(一 )课 程 与评价计划化 (统 整化
“ ”
台湾地区教育主管部门(2003,⒛ 08D实 行 的 中小学九年工贯课程纲要 规定 :学 校课程

J2 教学评估
表 1-3 中学 生 写作 测验 评分 标 准 一览表

牧 : = Ⅱ |

六级的文章十分优秀 ,此 种文章明显具有下列特点 :

● 立意取材 :能 依据题 目及主 旨选取适当材料 ,并 能进一步阐述说明 ,以 凸显文章的主旨。


搐 ● 结构组织 :文 章结构完整 ,段 落分明 ,内 容前后连贯 ,并 能运用适当的连接词联贯全文。
● 遣词造句 :能 精确使用语词 ,并 有效运用各种句型 ,使 文句流畅。
● 错别字、格式及标点符号 :几 乎没有错别字及格式 、 标点符号运用上的错误 。

五级的文章在一般水平之上 ,此 种文章明显具有下列特点 :

● 立意取材 :能 依据题 目及主旨选取相关材料 ,并 能阐述说明主 旨。


篮 ● 结构组织 :文 章结构大致完整 ,但 偶有转折不流畅之处 。
● 遣词造句 :能 正确使用语词 ,并 运用各种句型 ,使 文句通顺 。
● 错别字 、
格式及标点符号 :少 有错别字及格式 、 标点符号运用上的错误 ,不 影响文意表达。

四级的文章已达一般水平 ,此 种文章明显具有下列特点 :

● 立意取材 :能 依据题 目及主旨选取材料 ,但 不能有效地阐述说明主旨。


● 结构组织 :文 章结构稍嫌松散 ,或 偶有不连贯、转折不清之处 。
陋级
● 遣词造句 :能 正确使用语词 ,文 意表达尚为清楚 ,但 有时会出现冗词赘句 ,句 型较无变化。
● 错别字 、
格式及标点符号 :有 一些错别字及格式 、 标点符号运用上的错误 ,但 不至于造成理解上
的太大困难 。

三级的文章是不充分的 ,此 种文章明显具有下列缺点 :

● 立意取材 :尝 试依据题 目及主旨选取材料 ,但 选取的材料不够适切或发展不够充分。


● 结构组织 :文 章结构松散 ,且 前后不连贯 。
三级
● 遣词造句 :用 字遣词不够精确 ,或 出现错误 ,或 冗词赘句过多。
● 错别字、 格式及标点符号 :有 一些错别字及格式 、 标点符号运用上的错误 ,以 至于造成理解上的
困难 。

二级的文章在各方面表现都不够好 ,在 表达上呈现严重问题 ,除 了有三级文章的缺点 ,并 有下列


缺点:

● 立意取材 :虽 尝试依据题 目及主旨选取材料 ,但 所选取的材料不足或未能加以发展。



● 结构组织 :结 构本身不连贯 ,或 仅有单 段落 ,但 可区分出结构 。

● 遣词造句 :用 字 、
遣词 、
构句常有错误 。
● 错别字 、
格式及标点符号 :不 太能掌握格式 ,不 太会使用标点符号 ,且 错别字较多 。

一级的文章显现出严重缺点 ,虽 提及文章主题 ,但 无法选择相关题材 、 组织 内容 ,并 且不能运用文


法、字词及标点符号 。此种文章具有下列缺点 :

● 立意取材 :仅 解释提示 ,或 虽提及文章主题 ,但 无法选取相关材料加以发展 。


一级
● 结构组织 :没 有明显的文章结构 ,或 仅有单一段落 ,且 不能辨认 出结构 。
● 遣词造句 :用 字遣词有很多错误甚至完全不恰当 ,且 文句支离破碎 。
● 错别字、格式及标点符号 :完 全不能掌握格式 ,不 会运用标点符号 ,且 错别字极多 。

D级 重抄题 目或缺考 。
离题 、

敖据来源 :李 坤崇 ,⒛ OG年 国民中学学生写作测验试 办实施方案 ,⒛ ∞ 。

汁划应含各领域课程计划和弹性学习节数课程计划 ,内 容包含 :“ 学年/学 期学习 目标 、


能力指
” ”
对应能力指标的单元名称 、
标、 节数 、 各注 等相关项 目。可见 ,“ 九年一贯课程 已将
评价方式、
评价纳人学校课程计划 ,此 不仅是课程的突破 ,更 显示了课程与教学统整的意义。

第一章 教 学评 估理 念 ∫~l
(二 )教 学与评价统合化 、 ∷
适性化
教师为落实多元化、 适性化的教育理念 ,教 学与评价应统合化 、 适性化。评价木仅是蓣测
学生未来发展、 评定学习成果 要协助学生在教学过程中获得最好的学习,教 学与评价的统
,更
合乃未来评价 的发展趋势 (李 坤崇 ,19粥 ,2001a,⒛ Oz直 ;简 茂发、李琪 明、陈碧祥 ,1995;
Kubis乞 yn⒏ Borich,1987;Lihn&Gr° n!und,1995;Linn廴 Miller,2005;M|ller,Linn&
Gron1und, 2009)。 ∶ ∶ ' ・
unn与 Miller(2005)及 Mi11er,Linn与 Gronlund(zO09)以 简化教学模式 (如 图 1-2)来 ∷
学习与评价三者的相互关系。
摘述教学过程的基本步骤 ,并 说明教学、 ∷

确 认 教学 目标

事先评 价 学 习者 需 求

提 供 相 关教 学
1,监 督 学 习进展
2,诊 断学 习 困难

评 量 意 图的结 果

改善 学 习与教 学 评分 与 向家长报告 用 之 其 他 学 校 目的
.

图 1=2 简化的教学模式

《数 据 来 源 :M D MⅡ 1er,R。 L hm⒏ szr砌 吻 莎 oo9d

Ass纟 ssz″ ″砂j刀 rCαCfi犭 ,9g(10th ed.)。 River,NJ:Mcrr⒒ l,2009,p,35,)


Upper saddle`E,GronlutId,M饧

(三 )学 期评价计划化 、
精致化
有些教师评价学生学期成绩时,往 往提不出一套严谨的评价计划 ,使 学生不断质疑教师评
价的公平性与客观性。整个学期评价的统整思维 ,宜 包括评价计划 目标 1评 价 目标 、
教学 目标
类别与层次 、 评价方式与计分 (含 平时评价 、
评价范围、 阶段总结评价)、 各类评价方式、 内容所
占比例 、
评价运用方法、 补救教学1补 充说明及薮学评估通知单 :学 崩评价趋手计tlJ化 、
全貌
化、
精致化 ,将 评价与课程、
教学 目标呼应 ,并 将评价内涵详细而精致地呈现 ,不 仅提升评价信
效度 ,更 可获得家长与学生的信赖占


第五节 |改 善 教 学评 佑 的 实 施 建 议 ∷

经由十年来钻研教学评估心得 ,访 谈各县市中小学教师、
主任与校长 .搜 集推动课程改革
的经验 ,提 出下列中小学实施教学评估的原则、
条件与行政准备等实施建议。 ∷

T、 实施 教学评估应 掌握 的原则

中小学实施教学评估 ,应 兼顾专业多元 、
内涵多元
程多元 1时 机多元、
情境多元、
方式多
`过
元、 计分多元 、
人员多元、 结果多元等九项多元理念外 ,更 应掌握下列六项重要原则 。

f4 扶学讦估
(一 )掌 握 活化教 学与教学评 估 的趋势
教学或学习活动设计应充分结合活化教学 、
创新教学与多元化 、
人性化 、
精确化 、
统整化的
被学评估趋势 。教学评估视学生身心发展及个别差异 ,以 奖励辅导为原则 ,依 领域内容及活动
性质.采 取 口试 、 实作 、
表演、 作业 、
报告 笔试 、
据搜集整理、 晤谈 、
鉴赏、 实践等适当的教学评
`数
忙方式。
(二 )兼 顾认 知 、
技能 与情 意
教学评估内涵依能力指标或主题轴 、
学生努力程度、
进步情形 ,兼 顾认知 1技 能与情意等 目
诟 .引 导学生全方位发展 ,不 再仅局限于认知层次的学习。
(三 )纳 入小 组长评价 、同学 间互评 或 自评
实施教学评估时 ,除 教师评价外 ,设 计时尽量纳人小组长评价、
同学间互评或 自评 。
(四 )兼 顾平 时评价 与定期评价
中小学经常重视定期评价 ,却 较轻忽平时评价。平时评价的次 数 由任课老师依其课程需
要自行制订。定期评价的次数与时间可由学校各领域或各科课程小组制订。台湾地区的“小
学叉中学学生成绩评价准则 ”第四条规定 :中 小学学生成绩评价应本着适性化 、
多元化的原则 ,

蔽颐形成评价、总结评价 要时应实施诊断评价及安置评价。可见 ,中 小学实施教学评估应


,必
鞭颐平时评价与定期评价 占
(五 )适 当结合 学 习档案 与学 习成果记录
以往教学评估通知单只是让学生抄抄写写 ,做 完交给教师评 阅后随手丢弃 或备而不用 。
各学习领域或各科不一定每项活动均必须运用通知单 ,但 若运用宜结合学习档案 与学习成果
记录 .学 习单对教师而言系教学档案 ,对 学生而言系学习档案与学习成果记录。学生参与学习
逦程的同时 ,也 在累积其学 习档案与记录学习成效 。为顾及 过多的学习档案将造成师生的沉
蘧负担 ,因 而 ,教 师应衡量师生负担 ,适 当结合学习档案与学习成果记录。
(六 )充 分考虑 学生 的能力与努 力 ,兼 顾 质化 与量化 记录
“ “ ”
以前教师评阅通知单通常以打 √” 或打 × 来评定学生学习结果 ,此 种方式不仅过于笼
镟 .且 过于消极告知对错 。为突破传统评价记录之失 ,结 合学习档案与学习成果记录的通知单
贮采取兼顾质化与量化记录 ,评 价内涵兼顾认知、 技能 、
情意 ,针 对评价 内涵给予量化记录 ,评
涟量化采用等级制 ,而 非百分制 。等级制兼顾能力 、 ” “
努力向度 ,“ 能力 以符号 ○、√ 、△、?、
’ “ “ ” “ ” “ ”
⒒、表示 很好 、
不错 、
加油 、 补做 (交 )” 。 努力 以符号 +、 — 表示 进步、
改进 、 退步 。

二 、实施 教 学评 估 应 具 备 的条 件

中小学实施教学评估前 ,若 能了解应具各的条件 ,作 为规划与落实的评价依据 ,将 可事半


玎喑。
(一 )教 师
教师是多元化 、
人性化 、
精确化与统整化教学评估 的推动者 、
评价者 ,教 师的专业素养、

捱与意愿将是关键的条件 。
1,教 师专业素养
实施教学评估最基本 、
最重要的条件是教师的专业素养 ,若 教师无教学评估专业素养 ,则
趱论实施教学评估 。因此 ,推 动教学评估的第一要务为提升教师评价专业素养 。

第一章 教 学讦估理 念 ∫Γ
2.教 师负担与意愿
教师推动多元化教学评估的工作负担必然会较纸笔测验的工作沉重 ,心 理负担亦因家长

质疑而加重 。教师若推动意愿 ,则 取决于教育理想与工作 、
心理负担的拔河 教师坚持教育
'若
心理负担而致力于推动教学评估 占如果教师难 以承受负担 ,会 向现实妥协
理想 ,会 克服工作 、 ,

放弃教育理想 。 1
(二 )行 政
行政政策的精神支持 、
经费支持、 精确化与统整
场地或时间配合均系实施多元化 1人 性化、
化教学评估应具备的充分条件 。
'1.精 神支持
教师实施教学评估意愿与校长、 主任的精神支持息'崽 相关 ,若 校长 1主 任能秉持教育理念 ,

辛苦一点都值得 。若只是教师ˉ头热 ,校 长与主任在旁观望


力抗家长的质疑 ,则 教师累一点 、 ,

则教师在遭遇阻力后通常会裹足不前或干脆放弃 。 ∷
2.经 费支持
实施教学评估必然较纸笔测验耗钱耗力 ,教 师为理想耗力心甘情愿 ,但 如果经费仍需 由教
师 自行筹措 ,教 师通常会 回归纸笔测验。因此 ,实 施教学评估时 ,校 长 、
主任应积极 主动协助教
师解决经费负担 。
3.场 地或时间配合
纸笔测验只要在教室即可实施 ,不 限时间 :但 是实施系列实作评价 (如 过关评价 )必 须有

适当的场地配合 ,评 价时间亦必须审慎安排 ,才 不会造成评价失真 :
(三 )家 长
∷甚多教师反映 ,推 动多元化 (人 性化教学评估 的最大阻力在家长 ,尤 其是社会弥漫升学 主
重学历的气氛 ,家 长分数至上 、
义、 分分计较的心态 ,使 得实施教学评估困难重重。
1j家 长观念与心 态 ∷
家长观念能否扬弃升学 主义与文凭主义 ,心 态能否抛弃分数至上与分分计较 ,将 是能否落
实教学评估的基本条件。因此 ,扭 转家长观念与心态将是 中小学校长、 主任与教师努力 的重

点 ,亦 为各地教育行政机构的奋斗 目标 ,更 是教育主管部门推动教育改革的重点 。
2.家 长支持与配合 ∷
中小学有些领域 比较不强调认知 ,而 较重视技能与情意 ,如 综合活动学习领域强调实践 1
体验 ,艺 术与人文学 习领域强调听觉艺术、视觉艺术与表演艺术 ,必 然大量运用教学评估 。实
施教学评估有赖家长支持与配合 ,如 何获得家长的支持与寻求家长的配合 ,是 学校必须深思的
课题 。 ∷

三 、实施教学评估 的准备 工作

由上述具备条件 ,可 知中小学实施多元化 、 人性化 (精 确化与统整化教学评估应准各的工


作颇多 ,兹 阐述以供参考 ,力 求减少中小学摸索时间与提高行政效率 ,并 避免彷徨失措。
(一 )倡 导 、
沟通建 立共识
本人在参与九年一贯课程与高中课程改革时发现 :观 念倡导与共识建立是推动改革的基

没有共识将是缘木求鱼 ,推 动遥遥无期 :
础 ,观 念不改、

f6 教孛讦估
“ ”
实施教学评估必须 强化家长观念沟通、 消弭疑虑 。评 价变革必然衍生 家长的疑惑 、质
κ

攫。
怛家长或许因不了解教学评估 内涵 ,或 许因过分追求分数 、
重学历的心理作祟 ,或 许因要求

姓高 ・
或许对学校不信任 ,而 抱持观望、 批判态度。唯有面对 问题 ,方 能解决问题 ;唯 有消除疑
h`

艋ˉ
方能引发共鸣 ;唯 有凝聚共识 ,方 能发挥动力 。因此 ,教 育行政部 门与学校行政人员、 教师
坳宦循序渐进、分层负责来强化家长沟通 ,以 凝聚共识 ,切 实执行 。家长疑惑属全年级共 同问
趣肺 ・
由学年主任出面协调沟通 ;属 全校共同问题的 ,由 主任或校长解答疑惑 ;属 全地区共同问
趔肺 ・
由当地教育主管部门沟通化解疑惑 。
家长共识的凝聚需经一段时间 ,教 育行政人员与教师必须以耐心包容家长观念的转变 ,若
娜锩家长立 即配合学校步调调整 ,将 因急躁而适得其反 。实施教学评估 ,可 由校长、
主任每个
两戴两个月召开家长座谈会 ,解 决家长疑惑 、 澄清问题 ,至 少每个学期透过学校刊物告知课程
缬WTˉ 价变革 内涵与精髓 ,于 学校网站设置教学评估讨论区 ,公 告最新信息与解答 问题 ,出 席小
陋或舀委大会解说课程变革 ,以 及教师善用家庭联络簿夹带教学评估信息于家长。
J二)办 理 实作专 业研 习
为推动多元化 、 人性化 、
精确化与统整化教学评估 ,各 地方教育行政部门或学校应积极办
涮种子团队教师产出型研习 ,让 种子教师人数逐渐多于非种子教师 ,以 营造专业成长校园气
Ⅲ淝习重点在做不在听 ,在 想不在说 ,在 善用计算机与网络信息而非抄写汇编。种子教师在
概∷
龊陬合作产出作品而非各 自作战 ,在 学校共同推动而非孤军奋战 ,在 学校共 同抗压而非独 自
漱肛 夂

敬师专业循序渐进成长应 逐步推动渗透教师教学与生活”,实 施教学评估必须正视现今
驷肛学数师教学与行政负担沉重的事实 ,于 班级学生数未能大量减少 、 职员人数未能大幅增

腼螂 辙讨分量未能减少的情况下 ,推 动教师专业成长应采取 循序渐进 、 互助成长″的
相互观摩 、

樾式 冖 循序渐进可采取 由认识而适应 、由适应而试探 、由试探而检讨 、由检讨而改善 、由改善而

|毗 版 的历程 ,相 互观摩可采取读书会 、
座谈会 、
作品轮流展示 、上网张贴成果的方式 ,互 助成长
芯 揶砸蠖 产出型研习 ,经 由头脑风暴相互研讨 ,开 发成 品供全市教师运用或修改。

廷 敬矸专业循序渐进成长历程亦应 激励教师成长而非引发恶性竞争 ”,若 学校只藉教学评
奋 黼莛名 .以 五花十色的资料来争取大量资源 ,未 顾及教师的身心负担、 未启动 良性成长、 未避免
l 跏帷竞争 .将 使得教学评估在激情之后 ,衍 生家庭沟通、
身体适应或同学关系的问题 。校长应
1、 翩渤敬沛成长 ,拟 定阶段性 目标 ,引 导教师逐步稳健 、踏实地成长 ,留 意教师的身心负担 ,提 供
“ ” “
实 蠲咐蚺必要协助 ,方 能切实激励教师逐渐成长 。若实施评鉴 ,应 以 鼓励 、 沟通 、
建议 取代 批
嘟 .揩 责 、 ”
惩处 ,以 鼓励起点化与事实化 ,沟 通多元化与深人化 ,建 议具体化与积极化 ,避 免评
" 鉴只为批评 、只为指责 、只为惩处的传统弊端 。 ,
(三 )体 验 由生疏到熟 练 的过程
教师由精熟 、
惯用纸笔测验到愿意运用 ,正 确使用多元化 、
人性化 、
精确化与统整化教学评
临.并 非一朝一夕可达 ,必 须经历 由生疏到熟练的过程 。教师实施教学评估必须秉持循序渐进
螈剁 .而 循序渐进包括 自主化 、
积极化 、 合作化等 ,兹 说明于下。(1)教 师成长循序渐进
活泼化 、

督业化:教 师专业成长应采取 循序渐进 、 ” “
相互观摩 、
互助成长 的模式 ,循 序渐进可采取 由认

溉酾适应、 由适应而试探 、由试探而检讨 、由检讨而改善 、 由改善而成长 的历程。(2)教 师学习
儡哜渐进 自主化 :实 施教学评估 ,教 师应逐渐增进 自主学习 1逐 步提升专业 自主 ,必 须逐渐体验

第一章 教 学评估理念
终身学习的重要 ,逐 渐化被动为主动 ,强 化 自主学习能力 ,方 能摆脱以往不当心态 。(3)教 师心
态循序渐进积极化 :教 师心态由被动到主动 ,由 消极到积极 ,由 抗拒而接纳 ,由 接纳而参与 ,由
参与而主导 ,乃 一循序渐进 的 自然过程 ,推 动教育改革不能违反人性 ,不 能不了解教师处境 ,不
能不让教师有时间去调整 自己的感受 ,推 动教学评估 必须有时间让教师循序渐进调整心态 。
(0教 学方法循序渐进活泼化 :教 师面对教学的重大转变 ,必 须调整教学理念 、教学方法 、
教学
策略 ,然 而此调整并非一孰一夕可成 。教师或许产生相 当大的压力 ,但 只要设定 目标逐 调

整 ,逐 渐 由尝试错误 中省思成长 ,逐 渐 由同事观摩中研讨成长 ,逐 渐从学生回馈中修正改善 ,相

信 以两岸四地教师顶尖的资质必然可循序渐进调整。(5)教 学策略循序渐进合作化 :九 十年来
两岸 四地 中小学教师大多强调教好 自己的科 目,班 级或学科间教师合作更少 。然而 ,教 学评估
若无协同教学将有如缘木求鱼 ,若 无教师合作将难竟全功 。但教师间合作并非一蹴而就 ,由 单
“ ”
打独斗到协同教学的转折过程 ,除 有 共同目的 、沟通 、合作意愿 外 ,尚 须高度耐心 ,克 服过程
的沟通困难甚至误解 ,逐 渐培养信任与默契 ,逐 步迈 向共同拟定的教学 目标 。
(四 )调 整与研 发评价 办法 、表格 簿册
台湾地区小学 自 ⒛01年 、
中学 自 20∞ 年开始 自一年级实施九年一 贯课程改革 ,“ 九年一
” “ ” “ ”
贯课程 以三个面向、七大学习领域取代 中学课程标准 的二 十二科 、小学课程标准 的十二
生活化的学习取代学习支离琐碎 、
科 ,以 整合化、 叠床架屋 ,以 统整课程取代学科课程 ,来 培养
中小学学生基本能力 。随着课程改萆 ,学 校必须随之调整 、 研发教学评估的表格簿册 :
中小学贯彻教学评估必须调整、研发教学评估的办法 、 表格簿册 。李坤崇 (1999)提 出了改
善教学评估通知单 、 表格簿册的十点构想 :(1)兼 重学科表现、 生活行为表现。(2)将 学科或生
活行为表现具体化 、 细分化 。(3)兼 含等级评定 、 文字补充说明 。(4)呈 现阶段性结果 。(5)兼
顾能力、努力 。(6)兼 含教师 、
家长 、 学生 。(7)发 展学校教育 目标与评价项 目。(8)纳 人出缺席
记录。(9)引 导主题探索与 自省 。(10)着 重激发成就 、 给予鼓励
:

四 、推 动 教 学 评 估 之 策 略

经访谈各地中小学教师 、 主任与校长 ,进 行教学评估研究 ,及 推动课程改革的经验 ,提 出下


“ ”
列中小学实施 多元化 、 人性化 、精确化与统整化 教学评估的几点策略 。
“ ”
(一 )采 用阶段 省 思的 渐进推动 策略
李坤崇 (200⒛ )强 调现阶段家长与小 区人士普遍缺乏教学评估 的理念 ,教 师在教学评估
专业方面的能力仍有待充实 ,此 阶段若急欲完全落实教学评估 ,将 如缘木求鱼。实施教学评估
初期 ,应 从改善纸笔测验着手 ,搭 配评价表或检核表 ;待 教师教学评估专业逐渐成长 ,家 长逐渐
接纳教学评估后 ,再 纳人实作评价 、 档案评价及其他评价方式 。实施过程 中教师必须设定短、
“ ” ∵
中、长期 目标 ,把 握阶段 、 省思的 渐进推动 策略 。
“ ”
(二 )提 升专 业 素莽 的 学 习机制 策略
陈明印 (zO02)指 出 ,“ 教师评价的专业技术能否充分掌握教学评估精髓 〃是推动教学评估
发展的关键 。可见 ,教 师教学与评价专业素养 ,将 是推动教学评估 的主要动力 ,若 教师专业
不足 ,则 任何配套措施将大打折 扣 。李坤崇 (2002b)认 为 ,实 施教学评估学校必须先营造学
习型组织与建立学校学习机制 ,系 统规划教师所 需补强评价专业 的研 习活动 、 读 书会或行
动研究 ,提 供各项 自我学习的书籍或期刊 ,以 及办理校际观摩 、网络分享经验或互助成长活

18 较学讦估
动 .以 提升学校教师与相关人员的评价专业能力 ,方 能 以优秀专业素养为基础 ,落 实教学评

-。 “
(三 )善 用共 同参与的 民主参与 ”策略
实施多元化 、 精确化与统整化教学评估 ,最 重要的工作是理念沟通、
人性化 、 凝聚共识 。实
汩茳学评估须获得教师的支持与家长的认同,凝 聚学校 、 小区所有人员的共识 ,集 思广益共同
0与 与共同研讨 ,遵 循民主决策的机制来推动 。李坤崇 (2002b)强 调参与人员本应要求全体
愿意学习成长者先参与 ,先
0与 ,但 全体参与是最终 目标 ,初 期构思与研发阶段可请愿意付出、
3与 者不断坦然面对问题与解决问题 ,提 出解决问题的可行策略后 ,再 逐渐邀请其他人员参
与♀ 采取 由少而多 、 部分到全体的参与方式 。发展历程中校长 、 主任与领导人员应有耐心、 信
岫 ,等 待少数变成多数 ,忍 受批评责骂的雅量 ,逐 步凝聚共识 ,逐 渐增加参与人员 。
“ ”
(四 )激 励专业对话的 相互成长 策略
两岸四地尚未营造教师间专业对话的情境 ,教 师参与专业对话的意愿较低 ,使 教师形成单
枷狄斗习惯 、 养成敝帚 自珍心态。实施教学评估的参与人员若能透过专业对话 ,将 自已对教学
讦怙理念、 计划与心得 ,提 出与他人分享 ,不 仅可厘清观念 ,更 可澉励相耳专业成长。为
构想 、
扭升教师评价专业素养 ,有 赖提升教师专业对话意愿与营造其情境(李 坤崇 ,⒛ 02ω 。
“ ”
(五 )改 善行为 习惯的 提高效率 策略 Ⅱ
因应 21世 纪信息科技的发达 ,欲 以传统的工作与教学 习惯 ,处 理 日渐庞杂的工作及落实
“ ”
赦学评估理念 ,教 师必须本着 毁灭创造 的理念 ,省 思 自己 的工作习惯与教学策略 ,改 善 自EL
曲行为习惯 ,善 用信息与网络资源 ,并 对知识与信息作系统的管理 ,如 将数据计算机化 、 数据规

JIL、 数据系统化 ,方 能提高工作效率与提高教学质量 。
“ ”
(六 )营 造创璋 无惩罚的 愿者成长 策略
推动多元化与人性化教学评估必然面对升学主义高涨,家 长分数至上观念的阻力,推 动过
“ ” 容
猛必然遭遇甚多疑惑挫折,教 育局、 学校行政人员与参与研发人员均应抱持 支持鼓励 、 f包

尝试错误 原则,相 互挟持成长,方 能共赴目标。教育局、学校行政人员应积极鼓励 与提供专 业
戍长给有意愿教师,让 其在专业成长申获得信心与成就感,再 逐渐汇集有意愿者的力量,逐 渐
裙动无意愿者。在有意愿者带动无意愿者的过程中,有 意愿者逐渐增加且获得成长喜悦,而 扎
古臣者逐渐减少,自 然会给予无意愿者适度压力,故 不宜直接指责无意愿者,其 却会受到自然
惩罚。另外,教 育局、学校行政人员对无意愿者不宜过于保护,若 处处为无意愿者设想,∵ 心一
意想协助其成长,保 留研习与成长机会与无意愿者,将 相对减少有意愿者成长机会,因 此,过 度
保护无意愿者将阻碍学校发展动力。教育局、 学校行政人员应预先规划各项教学评估的进修
与成长系列活动,预 先告知并逐一执行,不 强迫不勉强,让 有意愿者逐期参加,待 此系列活动结
柬即终止,再 规划与展开其他主题的活动(李 坤崇,⒛ ∞ω。

五、结语

笔者数年来走访台湾地区 25个 县市与数十所高中职,发 现中小学不仅渐能掌握学校本位


课程、 创新教学理念,更 发展出颇具参考价值之实务成功经验。但因受限于家长升学主义观
念,及 教师专业培育历程较少涉及教学评估,使 中小学教师对教学评估仍深感力有不逮,遑 论
迈向多元化、 人性化、精确化、统整化的教学评估。

笫-幸 扶扌订估=仑 r9
∷ 多元化:(AJ± 化 、
精确化 i统 整化教学评估理念必须有 艮好的教育制度支撑 ,必 须有优秀Bt

专业教师推动 ,必 须有关Jo的 学生家长投人 ,亦 必须有关心的社会大众支持 。可见 ,多 元化、
精确化、
性化、 统整化教学评估是集体创作、 共同成某?雨 非教师△八△事 更非学校一校之事。
,∷

玉,激 起大家共同实现教学评估的理念-I∷ ∷ ∴ ∷∷ ∷∷ ∷
笔者希望借此书抛砖引∷

20 牧学讦估