教育测量与评价 下载本文

内容发布更新时间 : 2024/6/16 18:08:25星期一 下面是文章的全部内容请认真阅读。

《教育测量与评价》期末复习重点

一、名词解释

1.教育测量:指针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。

2.教育评价:教育评价是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。

3.常模参照:常模参照测量与评价是将被试水平与测验常模相比较,以评价被试在团体中的相对地位的一种测量与评价类型。

4.标准参照(标准参照测验):在一定的行为领域上按照具体的行为标准水平对被试的测验结果作出直接解释的测验。标准参照测量与评价是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在多在大程度上达到该标准。

5.典型行为:典型行为测量与评价要求被试按通常的习惯方式做出反应(即典型行为),其目的不在于测量与评价被试能力的高低,而是测量与评价是否具备某种典型行为。 6.最佳行为:最佳行为测量与评价是以测量被试的最佳行为表现为目的。如以成就或能力的高低作为评价基础。

7.重测信度:指用同一个量表对同一组被试施测两次所得结果的一致性程度。 8.复本信度:指两个平行测验测量同一批被试所得结果的一致性程度。 9.同质性信度:指测验内部所有题目间的一致性程度。

10.内容效度:指一个测验实际测到的内容与所要测量的内容之间的吻合程度。包括欲测的知识范围,以及该范围内各知识点所要求掌握的程度两个方面。

11.结构效度:指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验

分数能够说明心理学理论的某种结构或特质的程度。

12.实证(效标关联)效度:指一个测验对处于特定情境中的个体的行为进行估计的有效性。 13.区分度:指测验项目对被试心理品质水平差异的区分能力或鉴别能力。项目的区分度是测验是否有效的“指示器”。常记为D。

14.评价指标:指根据评价的目标,由评价指标的设计者分解出来的,能够反映评价对象某方面本质特征的具体化、行为化的主要因素,它是对评价对象进行价值判断的依据。 15.指标权重:就是表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这个数值就叫做对应指标的权数(权重)。

16.评价标准:是针对每个评价指标的分类作出具体规定,提出具体要求和说明。 17.常模:指一个有代表性的样组在某种测验上的表现情况,或者说是一个与被试同类的团体在相同测验上得分的分布状况与结构模式。

18.常模团体:是由具体某种共同特征的人所组成的一个群体或是该群体的一个样本。 19.百分等级:指在一个群体的测验分数中,得分低于这个分数的人数的百分比。

20.百分等级常模:就是基于某个常模团体,为某种测验的原始分数与百分等级之间建立起对应关系的组内常模类型。 21.智力:

⑴智力是抽象思维能力:智力是正确进行理解、判断和推理的能力。(Binet & Simon,1905)⑵智力是适应的能力或智力是学习的能力:智力是总括性的术语,指用来适应物理和社会环境的认知结构的组织和平衡的高级形式。(Piaget,1972)

⑶智力是多种能力的综合,是一种全面能力:智力是个体有目的地行动,理性地思考以及有效地应付环境的总体能力。(Wechsler,1939)

⑷总结:智力是各种认识能力的综合,它包括观察力、注意力、记忆力、想象力、思维能力

等,其中以抽象思维能力为核心。

22.晶体智力:是获得的知识与技能的有效结合之能力。适用于完成某种固定的任务。 23.流体智力:是洞察复杂关系的能力,是在不同环境和条件下都要显示出来的一般的普遍的能力。适用于适应新环境的情形下。

二、填空题

1.测量的基本要素是参照点和单位。

2.结构效度的验证方法:测验内部寻找证据法(内容效度、作答过程分析、测验的同质性、因素分析法)。P61-62

3.效标关联效度可分为同时效度和预测效度。

4.效标关联效度的估计方法:相关法(二列相关、积矩相关)、区分法、命中率。P63-64 5.客观性试题包括选择题、匹配题、是非题、填空题、简答题等。

⑴优点:答案客观,作答简便,在限定的时间内,测验可以包含足够数量的试才所测知识内容的覆盖面。客观题一般适用于测量知识、理解等几个层次的教学目标,在教育测验中用得较多。

⑵缺点:不能测量与评价高层次的教学目标,并且编制也较为复杂。 6.主观性试题包括论述题、作文题、操作题等。

⑴优点:适合于测量较高层次的教学目标,特别是测量综合、评价等目标层次。主观性试题鼓励被试积极地组织资料,表达点,有利于培养被试解决实际问题的能力。

⑵缺点:作答耗费的时间过长,在规定的时间内,试题数量不能太多,因而知识的覆盖面较小。由试题没有非常统一明确的标准答案,所以评分易受主观因素的误差较大。 7.常见题目编排方式有并列直进式、混合螺旋式。

8.测验的常模可分为两类:发展常模(年龄常模、年级常模)、组内常模。发展常模仅适用