学者谷

位置:首页 > 校园范文 > 语文

试卷质量的分析

语文1.43W

一、项目分析

试卷质量的分析

评价试题质量的指标主要是试题的难度和区分度,再是选择题分心答案的诱导效用性。项目分析是对每道试题的难度、区分度以及选择题的分心答案的诱导效用性分别加以分析。

1、难度分析难度是表示试题难易程度的指标。其计算方法是以学生答对某题的比率来进行的。依题型及评分方法的不同,可用下面几个公式计算。

<1>当用二值计分法时(只有答对或答错两种情况),可用公式P=R/N计算。P表难度,R表答对人数,N表受试总人数或抽样的总样本数。因受试者有可能凭猜测答对某些试题

2、提出了依D值大小,对试卷质量进行评价的标准。D≥0.4,质量非常良好;0.30≤D≤0.39,质量良好;0.20≤D≤0.29,质量尚可,应修改;D≤0.19,质量低劣,应淘汰。D值越大,区分度越高,则能力强、水平高的受试者得分较高;能力弱、水平低的受试者得低分,这样可把不同程度的受试者鉴别开来。影响区分度的因素较多,其中最主要的是难度,通过理论计算得出:当P=0.5时,D有极大值。由此可知,改变难度就可调节区分度。

3.选择题分心答案诱导效用性分析选择题在客观性测验与考试中应用最广。每题都由一个题干和几个备选答案组成。备选答案中,有对有错,且对与错有一定相关性,这样可使备选答案形成似是而非的状况。受试者在选择正确答案时,错误的答案会起到分心或迷惑作用,故错误的备选答案常被称作分心答案或诱答。对受试者来说,只有认真地分析、比较,才能选出正确答案。那些对所学知识掌握不够好的受试者,常被诱答迷惑住,那么该诱答就失去了应有作用,其效用性就低。分析诱答的诱导效用性,其方法是比较高分组和低分组选答每一个诱答的人数。良好诱答,应促使高分组选答它的人数少于低分组选答它的人数。设高分组选第i个诱答的人数为H,低分组选其人数为L。对i诱答,若满足L>H,则该诱答的诱导效用性就高。若一个选择题的几个诱答都满足上述条件,则该题的质量就高。

综上所述,对试题分别进行三个项目分析后,依分析结果,即可对试题质量作出综合评价。

二、总体分析

试卷质量不仅与试题质量有关,而且还与试题的选取、编制等因素有关。通常可用信度、效度及受试者成绩的统计分布状态来反映试卷的总体质量。

1.信度分析测验与考试是测量受试者知识、能力、技能等方面的重要手段。凡测量,必有一定的误差,而测量误差的大小,决定了测量结果的可信程度。如果误差超出了规定的范围,测量结果就不可信了。试卷的信度就是衡量试卷可信程度的指标。

试卷信度可用信度系数来表示,系数越大,信度越高,试卷可信程度亦越高。计算信度系数有几种方法,如再现法、等值法、两分法。这三种方法均涉及到积矩相关数公式的应用,数据处理甚为繁琐。笔者在此介绍一种十分简便的方法:查表法。先求出试卷中各试题区分度的

2.效度分析效度总是与测量目标密切相关的。关于测验与考试,对某个目标有效的试卷,对其它目标不一定有效。涉及试卷的效度有两种:一是内容效度;二是效标关联效度。对效度的分析,以定性为主,定量为辅。

<1>内容效度分析内容效度指试题取样是否充分概括了所要测量的全部内容,亦即其代表性如何。教材内容和教学目标是内容效度的两个基本要素。这里教材内容是指“主题”或“教材领域”,如普通化学包括物质结构与化学键、溶液与酸碱理论、电化学初论、元素及其化合物等主题,亦可分得更细,每章代表一个主题。教学目标指学生的学习结果。按布鲁姆的分类法,可将教学目标分为知识、理解、应用、分析、综合、评价六个方面。在分析内容效度时,应同时考虑教材内容和教学目标这两个基本要素。

对于测量学业成就的测验与考试来说,内容效度是最主要的。影响内容效度的因素很多,试题难度、区分度较大的试题可以提高内容效度。此外,试卷中所涉及各教材内容、教学目标的权重以及诸试题的独立性对试卷内容效度有很大的影响。

试卷中所涉及教材内容、教学目标的权重,一般依它们的相对重要性来确定。而相对重要性的确定,目前尚无具体可行的方法,大多依专家的意见来确定。就教材内容的权重而言,笔者以为可以从诸教材内容在教材中所占比例(如页数比、习题比)以及按大纲教学所用学时数占总学时数之比来确定教材内容的权重。

如果某试卷中的教材内容的权重偏离表(依具体教材及大纲编制的计算表)中权重较远,则会对试卷内容效度带来不利影响。

对于各学习结果(即教学目标)的权重,只能定性而论。其权重的大小与测量目标有关,而且诸目标之间的相关性很高,相互间的界限不甚明朗。从发展趋势来看,在试卷中,尤其是测学业成就的试卷中,应增大测量应用、分析、综合、评价等与能力有关的教学目标的权重,而纯知识(主要靠死记硬背)内容的比例不宜过大。一般而论,其值不超过百分之五十。

试题的独立性对试卷内容效度也有一定影响。试卷中,各试题都应有独立性,各题之间不能相互提供额外的'解题信息,并且测A教材内容的试题不宜渗入B教材内容,除非A、B间相关性很高或测受试者综合应用知识的能力。例如在“建筑材料”这门课程的试卷中,测“水泥”这一章教材内容的试题不宜掺进“气硬性胶凝材料”这一章的教材内容。因为水泥属水硬性胶凝材料,它与后一章教材内容无相关性。若渗进了后一章内容,就会造成测量目标不明确,使测水泥的试题失去了独立性,这样会降低内容效度。倘若在测水泥的试题中掺进了“混凝土”这一章教材内容,尽管使该题失去了独立性,但“水泥”与“混凝土”相关性很高,故而试题的测量目标仍很明确,只是其由单一性变成了综合性。我们在分析时,应明确各试题的测量目标以及各试题所涉及教材内容之间的相关性,就可对试题的独立性作出判断。试题独立性强,有利于提高试卷的内容效度。

从以上论述中可以看出,对试卷进行内容效度分析要综合考虑多种因素。既要利用难度与区分度分析,又要定性确定教学目标的大致比例和定量计算材料内容的权重,同时还要判断试题的独立性。难度适中、区分度较大的试题有利于提高试卷内容效度;各试题所涉及教材内容的权重与按表中所示方法计算出的权重大致相符时,有助于提高试卷的内容效度;独立性高的试题对内容效度有积极贡献;诸教学目标的比例适当对内容效度有积极影响。

<2>效标关联效度分析效标关联效度是指一个测量结果与另一个可以作为效标(即效度标准)的测量结果的相关程度。譬如,高考前的摹拟考试试卷可将往年高考试卷作效标。摹拟试卷的效标关联效度就是指这两种试卷间的相关程度,二者相关程度越高,摹拟试卷的效度越高。由于其它试卷难以寻到对应的效标,所以常用定性方法加以分析。例如:教师依平时的考查,认为李的某一课程学得很好,若李在该学科的期末考试中取得优秀成绩,则可说明该试卷的效度较高。在这里,教师平时的认真观察和记录的结果就充当了效标的作用。

3.成绩统计分布状态分析一般而论,对同组受试者,成绩拔尖的少,成绩差的少,较优、较差的要多一些,而多数受试者的成绩处于中间状态。亦即成绩分布曲线属于或接近正态分布曲线。基于此点,就有必要对成绩分布状态作一分析,看其是否属或近正态分布。具体方法如下:

①将百分制成绩划分为若干个分数段,并定其中点值。一般将5分作为一个分数段。

②在全部分数中确定各分数段的人数。

③以分数(中点值)为横坐标,各分数段人数作纵坐标,建立一个坐标系。

④描点、作图。描点时,以各分数段的实际人数作为纵坐标值,相应分数段的中点值为横坐标值。如90-94分数段有4人,该段中点值为92,则可在坐标系中找出点(92,5),将诸点连成光滑曲线即得成绩分布曲线。

依前述方法作出的曲线,若为正态分布曲线,则成绩统计分布较为正常,试题的难度、区分度较适宜,试卷质量较好。

结束语

决定试卷质量的指标较多,且诸指标间相关性很高,我们在进行试卷质量分析时,应综合考虑诸指标对试卷质量的影响,从而为合理评价试卷质量提供科学的依据。

标签:试卷