- A+
小学考试分析总结范文第1篇
关键词:试卷分析信度效度区分度
一、引言
教学与测试分不开。测试可以检测教学的结果,为提高改善教学提供有效的信息。如今,英语已经成为对一名复合型人才的要求,学习英语的人越来越多,几乎所有院校都有开设英语专业,还有各式各样的英语培训机构。但是老师们教得如何,培训机构培养得如何,人们学英语到底学得如何,特别是英语专业的学生们的英语又怎么样,我们还是要通过各种各样的考试来检验。我们熟知的英语考试很多,比如全国英语公四、公六考试,出国留学的雅思、托福考试等等一系列的考试。这些考试测试操作严格,有很完整的试卷设计、测试操作、评分操作、还有试卷分析过程,获得了人们普遍的认可。其实在英语教学的过程当中,我们对于大大小小的测试也要学会对测试试卷的分析,以获取老师教与学生学的准确信息。我们首先要保证我们的测试是客观的和科学的,从而发现我们在试卷设计上存在的问题和需要改进的地方,不断吸取教训,积累经验, 提高我们的测试水平和测试能力,为教学提供真实有效的反馈信息。本论文选取2007级英语专业一次精读半期考试试卷为研究对象,分析讨论了试卷题目的信度,难度系数,区分度等,为以后此类考试题目的设计提供一定的参考信息和建议。
二、测试的信度、效度、难度与区分度的基本概念
(1)信度:信度是指测试结果的可靠性和稳定性,即如果用同一份试卷对同一组学生进行前后两次测试的话,两次测试成绩在多大程度上会相吻合。信度受试题的质量、考试的组织、试卷的评判等因素的影响。要保证试卷有较高的信度,首先试卷要有一定的量,一般题量越大,信度越高。同时作为考试结果的分数要有一定的分散度,要呈正态分布,及中间大,两头小。要达到这个要求,就必须保证试题具有一定区分度,且难度适中。
(2)效度:效度就是考试的有效性,是指考试是否测量了它所想要测量的东西,即考试是否达到了目的,考试所考的内容是否是想考的内容。效度包括表面效度、同期效度、构卷效度和内容效度。这里我们将主要讨论内容效度。内容效度是指是否考了大纲规定要考的,或者说考试的题目在多大程度上能代表所有测量的目标。主要是测试的内容是否和测试的目标有关;测试内容是否有代表性;是否全面地体现了要考查的各方面的内容;试卷中是否有足够的题目去体现所要考的各方面内容;测试内容是否适合测试对象等。(刘润清, 韩宝成. 2000: 172)
(3)难度系数:难度一般以正确或错误回答某道题的人数与总体人数之比作为指标,一般来说,最好是测试的平均难度接近 0. 5。对于对错型项目的难度系数的计算公式为:P=答对题目的学生人数/总的答题学生人数
难度系数的数值越大,难度反而越小,项目越容易。
而对于非对错型项目的易度指数难度,就是一组受考的成绩率。所谓的成绩率,就是一组受考在一个项目上的平均成绩与这个项目完全做对时的成绩的比率。其计算公式为:P=学生在这个项目上的平均成绩/这个项目完全做对时的成绩
一般来说,难度系数在0.3~0.7之间是可以接受的,难度系数达到0.4~0.6的项目是比较好的。
(4)区分度:区分度是指对考生实际水平的区分程度。区分度用D 来表示。当D为正值时,说明试题为积极区分,即高分组通过率高,低分组通过率低,当D为负数时,说明该题是消极区分,高分组通过率低,低分组通过率高。一般来说,我们将所抽出的总学生分为高分组,中等分组,和低分组。高分组和低分组各取抽样总人数的1/3。区分度的计算公式为:
区分度=高分组在该项目上的通过率―低分组在该项目上的通过率
区分度最大值为1,最小值为-1。区分度可以显示项目的质量。一般来说,区分度应该大于0.2。小于0.2的项目质量比较差,应该予以淘汰。
三、试卷分析结果和讨论
这次我们选择了2007级英语英语语言文化系2009-2010学年第一学期《高级英语》期中考试试卷,总共抽取了26位同学的考试成绩进行试卷分析。
试卷的题目清楚,排版一目了然,试题没有拼写错误。这首先能够保证学生不会因为没有误读题目而答错题目。在此基础上再就试卷进行分析。
1. 我们先看一下这份试卷的结构。
这份试卷分为六个部分,考察了学生的词汇知识、语法知识、写作能力、语言的综合运用能力以及识记能力。有四个主观题型,分值占65分。分别是选词填空及词型变换、释义改写、改错、和篇章理解,考察了学生的词汇、语法和写作的能力。两个主观题型,分值占35分。分别是阅读理解和常识选择,考察了学生的阅读推理能力和识记的能力。另外试卷总共题目差不多60个。
从结构上来讲,信度和效度这份试卷是较好的。首先,试卷的题型比较多,有六个。比较全面地考察了学生的能力,是具有效度的。像改错,释义改写,篇章理解这样的考察学生语言综合运用能力的很好的题目占到了55分,一定程度上保证了学生考试成绩的稳定性和可靠性。另外,60个项目的题量也比较合适。考试时间为两个小时,学生可以有充足的时间把答完卷子。对于期中考试这样的非选拔性考试这是合适的。
2. 学生成绩
抽取的26人的考试成绩为67.2分,24人及格,2人不及格,通过率为92.3%。
平均分以上的有13个,刚好一半。对于期中考试这样的非选拔性考试是可以的。
再看下面的学生成绩分布图
学生成绩基本上称中间大,两头小的状态,但是60分到65分的人数比较多,正态分布图还是不够明显。初步反映出题目的设置有些问题。当然也许这和我们选择的人数太少有关系。只有对试卷的难度和区分度仔细分析后,我们才能更清楚地了解试卷的具体质量。
3.试卷的难度、区分度
试卷各个题型的难度系数几乎都在0.6以上,多数在0.7左右,甚至有的达到了0.8,可以知道试卷的总体难度系数不大。对于像期中这样的非选拔性考试来说能够保证大多数学生通过,是可以的。但是选词填空与词型变换这一题难度系数达到了0.8,可以适当加大,而改错题目难度较大,可以适当减小难度。学生说明题目的区分度也是不错的。多数题型的区分度在0.2以上,释义改写和阅读选择的区分度甚至达到了0.4~0.6之间,是很好的。但是选词填空及词型变换、改错的区分度为0,说明题目出得不够理想,这样的题目下次应该不再选择。但这并不是说这样的题型不好,而只是针对这次选择考试的题目还存在问题。下次应避免这样的题目的出现。
具体到各个题型看考察学生的能力,可以发现学生做其它题还好,做改错题,和阅读理解题还不够不理想,特别是改错题,原因到底在哪里?改错题,阅读理解题,还有篇章理解题同样是考察学生的语言综合应用能力,为什么篇章理解题的难度系数小这么多?改错题和阅读理解有标准的答案,篇章理解的答案却是灵活的,老师在评卷过程中的标准是不是影响了学生的整体分数?进而影响了试卷的难度系数值。这一定程度上降低了试卷的信度。
4. 阅读理解和常识选择的分析
这一题主要考察的学生的识记的能力,所以只要学生记住了知识就能够答得对。这一题的总的难度系数也只有0.7,算是拉分的题目了。甚至出现了第五题这样的送分题目,一点难度没有外,也没有区分度。虽然说我们需要保证一定的通过率,但是题目也不能没有难度,只是说难度要适中。但是这一题难度不一,好些题目难度不是太小就是太大,比如第六、七、九题就是难度太小,而第十题又是难度太大了。再说区分度,虽然区分度都是正数,是积极的,但是总的来说这题型区分度过小,一、二、三、五、六、七、九区分度都小于0.2,属于应该淘汰的项目。只有四、八、十这3题的区分度可以接受。但从难度、区分度一起看的话,只有第八题是比较理想的题目。即使作为拉分的题目,这道题型所设的题目还是需要大加改进,一定程度上拉开学生之间的差距,增加试卷的信度和效度。
阅读理解是考外语时学生们通常做过的题型。它的出题可以很灵活,可以考察学生的迅速反应查找信息的能力,逻辑推理能力。但是老师们通常喜欢出的题就是选择题。
这份试卷阅读理解的平均难度系数为0.612,难度适中,总体比较好。不过有些题目难度还是不够好,比如八、十四、十六。再看比如区分度,很不理想。五道题目的区分度为负数,四道题目的区分度为0,另外还有六道题目区分度不到0.2,总共十五道题目都应该淘汰,比例太高了。但是也有很好的题目,比如说第二题,难度0.42,区分度0.5,刚刚是我们最最需要的。
所以说虽然选择题是老师很容易出的题型,也是老师们喜欢出的题型。但是选择题很难出,从上面的分析我们可以看得出来。
四、小结
作为半期考试,这张试卷的题型是不错的,主观题客观题的分配比例适中,便于老师修改试卷,总体的难度还够,对于非选拔性的考试还算通过。但是试卷也暴露出一些问题。题目项目的难度区分度还有很多需要改进的地方。特别是区分度的把握上,非常弱,不能明显地区分学生的能力。选择题的难度区分度不理想,有些题目该淘汰的应该予以淘汰,该改进的改进。还有评判试卷的标准也要适度。
这只是我们就一次半期考试作的简单的试卷分析。虽然简单,可以反映出试卷所暴露出来的问题,可以给老师们发现学生们的薄弱处,加强这方面的教学。比如这次的改错和阅读理解,学生们做得不好。在以后的教学中,老师就可以对症下药,加强学生的语法知识和阅读技巧的训练,或者提醒学生自觉加强这方面的练习。
所以进行试卷分析是十分必要的。每次考试后,老师们应该坚持进行试卷分析,暴露显示的问题,了解需要改进的地方,提高教学质量。学生们如果能做做试卷分析,了解自己的不足,对于提高学习效果也是非常必要的。
参考文献:
[1]陈晓扣, 李绍山. 谈语言测试的结构效度[J]. 外国语学院学报, 2006(03),45-49.
[2]黄和斌. 外语教学理论与实践[M]. 南京:译林出版社, 2001.4, 223-240.
[3]刘润清. 外语教学中的科研方法[M]. 北京: 外语教学与研究出版社, 1999.
[4]刘润清, 韩宝成. 外语测试和它的方法(修订版)[M]. 北京:外语教学与研究出版社,2000.
[5]苏惠芬. 英语试卷质量分析方法研究[J]. 卫生职业教育, 2007(06), 45-46.
[6]孙成岗. 现代语言测试与试卷分析[J]. 外国语学院学报, 2000(04), 82-86.
[7]汪美琼. 大学英语试卷分析探析[J]. 青海师专学报, 2008(02), 103-107.
[8]王新. 浅谈试后卷面分析的重要性[J]. 长春理工大学学报(社会科学版), 2004(03), 83-85.
[9]刘丽华. 英语专业精读期末考试内容效度的个案研究[J]. 泰安教育学院学报岱宗学刊, 2009(01), 104-106.
[10]徐欣, 王秋生, 高庆山. 试卷分析学校教学及教学管理的指导作用[J]. 北方经贸, 2000(05), 159-160.
小学考试分析总结范文第2篇
关键词:大学;成绩分析;教与学
中图分类号:
G4
文献标识码:A
文章编号:1672.3198(2013)03.0135.03
1引言
大学校园是大学生学习专业知识,完善自身能力的殿堂,然而在各大学高校中,大学生对学习的积极性不高,补考重修的现象极其普遍。试卷中课堂上多次讲过的理论知识,答案正确率却很低。通过对大学生试卷答题成绩的分析,研究试卷得分的相互关系并追溯其根本的原因,可以充分了解到大学教与学的现状。对这种现状进行反思,找到能够改进的方法,为教师提高教学质量,学生改变学习态度提供借鉴,具有重大的现实意义。
2概述
2.1基本情况
我们主要针对A学校的两个专业中的四个班的宏观经济学成绩进行分析。其中b、c班学生的专业是金融学,共有81人(简称金融班),d、e班是国际贸易专业,共有77人(简称国贸班)。不同专业的四个班人数相仿,都属于经济类专业,并且由同一个老师教授,具有可比的基础。据了解,金融班与国贸班的上课情况有一定的区别,与国贸班相比,金融班大部分学生都按时上课,上课与老师互动较多,回答问题积极且作业完成较好。这些表现都体现在平时成绩中。宏观经济学总评成绩根据试卷总分的70%与平时成绩的30%总和进行计算,最终的结果作为衡量学生是否挂科的基础。
2.2主要研究内容
学习成绩是考核学生学习结果的主要方法,而学习结果受到客观因素即课堂环境,教师传授知识程度,也受内在因素个人学习态度等的影响。本研究首先实地考察了两个班的课堂情况,结合授课老师的评价,对两个班级的课堂的整体情况进行了解,接着通过对学生最后的学习成绩与课堂整体教学情形、知识接受情况、学生学习态度、挂科率、男女生差异之间关系的分析,得出教学中的几点现状和相关的结论并分享几点启示。
3实证分析
3.1研究假设
由于不同班级学生组合的差异,在课堂上不同的班级与老师的互动性往往不同。而我们认为这种现象最终将会体现在不同班级学习成绩方面的差异上。因此假定:H1:课堂互动性强的班级总体成绩较好。另外,由于个人因素对学生成绩的影响较为重要,比如到课率、上课思考问题的程度、课后思考、课后预习复习情况等。而课后的情况收集困难,并且可信度不易测量,在本研究中,我们把相比更为客观的到课率、学生上课回答问题的积极性作为考核学生平时表现的平时成绩,即作为衡量学生学习态度的主要标准;把试卷卷面总分作为衡量学生课程学习情况的具体表现;而把试卷中几乎每节课都讲到过且进行详细总结的论述题的得分作为一个具体的知识板块考核学生接受知识的程度,并假设论述题知识模块掌握程度中等及以上的学生超过60%,则认为大学生知识接受程度高;总评成绩综合考虑了总分与平时成绩,且小于60分判定为挂科,因此把总评成绩作为是否挂科的标准。综上所述,我们假定:H2:大学生知识接受程度很高。H3:学生的卷面总分与平时成绩正相关。H4:平时成绩优秀的学生基本不会挂科。由于男女学生的教学环境相同,并且考试试卷是同一的,我们假设:H5:男女生学习成绩差异不显著。
3.2样本的选取
我们选择A大学的金融班79份,国贸班71份试卷共150份宏观经济学试卷成绩作为有效样本,其中剔除了补考和重考的8份试卷。利用SPSS 19.0统计分析软件进行实证分析,以此证明我们的假设是否成立。
3.3统计结果及分析
3.3.1两个班级的试卷总分差异分析
据表1,金融班的平均成绩大于国贸班的平均成绩,说明金融班的成绩总体水平高于国贸班;而标准差小于国贸班的标准差,说明金融班总分的离散程度相比国贸班比较小,学生成绩总体比较均衡。由此可以看出,课堂互动对班级的总体成绩会有一定的影响,课堂互动好的班级会有更好的考试成绩结果。证明原假设成立。
3.3.2论述题的总体得分分析
首先对论述题的总体情况进行描述性统计。得出的结果如下表:
从表中可以看出,论述题得分均值小于6(总分为10分),说明学生在这道题的成绩普遍偏低,偏度为负数,说明论述题的正态分布图往左偏,总体来看,得分低的学生数大于得分高的学生数。
由于论述题在试卷上的赋分值为10分,在总分为100分的试卷里占分比10%。考虑到可能的问题难易程度,我们不采用单纯的6分制为及格分的形式,而把论述题得分占学生试卷得分的比例作为得分情况(表3)的一个关键因素。根据论述题在试卷中赋分的比例,我们认为若某个学生的论述题得分大于或等于6分,且占试卷总分比例(设为a)大于或等于10%,则认为他的论述题这个知识模块掌握的好,而低于6分,且比例低于10%,则说明他这个知识模块掌握的不好。根据统计:
很容易看出,论述题知识模块掌握的不好的学生所占比重明显比掌握程度好的学生高。掌握程度不好的学生比例超过40%,说明学生的知识接受程度没有达到高水平。否定原假设。
3.3.3学生总分与平时成绩的关系分析
根据A班授课老师的打分标准,首先对平时成绩的情况进行频度的统计(表4):
可以看到平时成绩大于等于85分的比例达到76.7%,说明平时成绩高分比较多,我们认为,平时成绩大于或等于85分的学生学习态度比较好,平时成绩属于正常的区间,而小于85分的同学学习态度差,平时成绩偏低。经过P-P图和Q-Q图的检验,发现两类学生平时成绩和总分基本服从正态分布,因此分别对这两类学生平时成绩和总分的相关性进行Pearson相关度检验:
(1)学习态度差的平时成绩与总分相关性检验。
结果发现,学习态度差的学生平时成绩与总分存在着高度显著的正相关关系,且Sig=0
在此基础上,对学习态度差的学生平时成绩与总分进行一元线性回归,得到回归系数表:
可以看出,学习态度好的学生平时成绩与总分也是正相关的,Sig=0.014
在相关性分析的基础上,对学习态度好的学生的平时成绩和总分进行线性拟合,发现线性和曲线拟合度都比较差。说明它们之间的线性关系并非很明显。
然而,对学习态度好的学生总分进行频率分析:
可以看出,学习态度好的学生总分低于60分的学生只占其中的13.9%,说明学习态度好的学生基本上成绩都比较好,只有小部分可能因为理解不透彻,缺乏有效的复习等其他原因,考试成绩低于60分。
总体来看,不论是对学习态度好的学生还是学习态度差的学生,学生的总分都与平时成绩有着正相关的关系。并且学习态度差的学生的平时成绩与总分之间还存在着一元线性关系。这也证明第二个假设成立。
3.3.4平时成绩与挂科的关系分析
由于授课老师对学生的总评成绩往往参考平时成绩,并且按照一定的比例进行计算最后的总评分。因此平时成绩毫无疑问对总评成绩产生很大的影响。为了分析两种不同类型学生的最后可能挂科的情况,仍然对它们之间的关系进行区别分析。
根据表11和表12的对比,学习态度差的学生总评成绩中有17.1%小于60分,说明学习态度差有将近1/5的学生可能会挂科,而学习态度好,平时成绩比较高的学生,尽管其中有13.9%的学生总分小于60分,但根据总评成绩的比例平分,最终却没有人挂科。虽然这只是这4个班级的具体情况,但至少我们可以得出:学习态度好的学生基本上不会挂科的结论,证明原假设。
由表14知,男生赋值为1,女生赋值为2,方差的Levene的F检验Sig.值为0.015
4 结论与启示
4.1结论
(1)课堂互动对学生成绩存在影响。分析表明,课堂互动好的班级学生学习效果相对较好。
(2)大学生的知识接受程度现状并不理想。课堂多次讲述的知识点掌握程度不高。
(3)学生的学习成绩与平时成绩存在着正相关关系。且学习态度差的学生,平时成绩与学习成绩相关高度显著,且存在一元线性关系;而学习态度好的学生学习成绩也会受到平时成绩的影响,但线性关系不明显。
(4)学习态度差的同学挂科机率较大,而学习态度好的学生基本不会挂科。
(5)大学男女生学习成绩存在显著差异,女生成绩稍优于男生。
4.2相关启示
(1)改进教学模式。课堂上应形成教学互动的形式。传统教学多数是课堂上“讲解―接受”、“示范―模仿”的模式,这种模式从中学以来在大学还没有得到实质的改变。而这种模式往往不能激发学生上课的积极性,课堂互动很难调动起来。而大学是一个鼓励学生创新式思维的地方,教学的功能是学生通过学习获得更加适应社会的能力,重点应该突出学生而非教师。因此在教学的过程中,应该消除以简单的知识传授和应付考试为满足的教学方式,教师要注意激发学生学习的积极性,同时关注促进学生逐步提高主体意识。例如,可以通过合作学习模式,即学生经过分组,让学生在学习过程中充分利用所学的知识,达到老师所要求的课堂内及课堂外的小组学习目标。这样在考察学生知识的同时,也能锻炼小组之间的合作、协调能力,提高每个学生的整体参与度。
(2)改革成绩考核结构。在研究的过程中,我们发现目前大多数学校的评分标准中,最终试卷考试的成绩占有绝大部分比重,平时成绩也主要集中在出勤、课堂表现和作业上,很难考察到课后学习的情况,因此很多大学生平时学习不努力,直到考试之前的临时抱佛脚现象比较严重。改革现有的成绩考核模式也显得比较迫切,比如增加课堂内考核,小组任务考核、期末知识答辩考核等平时考核的比例和范围,把成绩的最终控制改革成为过程控制,根本上改变“一考定成绩”的模式;期末试卷考试更加注重知识与理论相结合的考核,根据课程实际情况灵活选择开卷与闭卷的形式等。
(3)大学生应该注重端正学习态度。由于学生自中学以来长期在教师督促下学习,形成了对待学习主动性不高的习惯,而在学习环境相对宽松、老师督促较少的情况下,大学生们普遍内源性学习动力不足,抱着“60分万岁”的态度对待课程的学习。因此自主学习、端正学习态度是现在大学生必须重视的问题。根据对学习态度与挂科之间关系的分析,也为学习态度重要性提供了理论依据。而针对这种情况,学校应努力提高大学生对学习的认识。如:通过思想素质教育,让大学生们认识到学习是自身技能提升的重要手段,并以报告会等形式引导大学生转变中学的学习模式。大学生个人应认识到大学学习对自身完善的价值,端正学习态度并持有不断吸收新知识的心态才能不虚度青春。
参考文献
小学考试分析总结范文第3篇
关键词 SPSS软件 学业成绩 高职学生
随着我国高等职业教育的发展,为了保证高等职业教育的质量,有必要对高等职业院校的教学工作进行全面评估。其中,学生学业成绩的评价是教学质量评价的一项主要内容。本文结合高职学生学业成绩的评估工作,应用SPSS软件进行分析,得出学生学业成绩总体情况,得到试题的难度、区分度、信度等,还有学业成绩的差异性与相关性,使教师、高职学生得到学生学业成绩的评价反馈,在某种程度上促进教学质量的提高。
1 研究对象与方法
随机选取某高职院校学生100名,其中,男生73名,女生27名。试卷来源GXGZY高职学生电工应用技术考试。数据管理与分析采用SPSS软件。通过软件测量得出学业成绩的一般信息,进一步对试题的效度、信度、难度、区分度等进行分析,对不同班级、性别、民族等的考生成绩进行差异性检验。
2 研究结果
2.1 考试题目的题型结构及分值分布
试题共四大题。第一大题为判断题,共10小题,共20分。第二大题为填空题,共6小题,共30分。第三大题是选择题,共四小题,共12分。第四大题是计算题,共3小题,共38分。
2.2 学业成绩描述统计
学业成绩的基本描述统计量包括极小值、极大值、均值、标准差、偏度和峰度等。均值代表数据的集中趋势。数据的离散程度可用标准差描述,标准差越大说明数据间的差异越大。偏度和峰度用来描述数据分布是否对称,偏斜程度如何,分布陡缓程度等。①
在SPSS中可以进行以下操作:分析描述统计描述总体考试成绩选择到变量框中单击选项选择描述统计量确定。统计结果输出,统计量100,极小值19,极大值97,均值59.98,标准差18.419,偏度-0.005,峰度-0.880。同时可以输出频数分布图,看看成绩分布情况。操作步骤:分析描述统计频率成绩选择到变量框中单击图表选择直方图,带正态曲线继续确定。从偏度、峰度以及频数分布图可得,总体成绩基本符合正态分布,说明这份试卷达到了检测学生学习水平的目的。
2.3 考题的难度
难度是指全体被测对象对该题目的失分率。计算公式:难度系数P=1-(考生在该题目所得分数的平均值/该题目满分值)。样本总体平均值59.98,各大题难度系数分别为:0.24、0.42、0.37、0.48;标准差分别为:2.953、7.319、2.677、10.854。一般认为难度范围应在0.3-0.8之间比较恰当,仅有第一题难度小于0.3,为判断题,题目都比较简单,只要学生掌握基本知识,仔细判断就可以得高分。计算题最难,排在最后合适。选择题难度排第二,应该排第二,让试卷题目的难度成递增趋势较好。从试卷总体来看,总分难度系数为0.4,难度略偏容易。
2.4 考题的区分度
区分度是指考题对考生实际水平的鉴别能力,是把考生区别开来的统计量。在SPSS中可以进行以下操作:分析相关双变量把学生某题成绩与总分选择入变量框中选择相关系数Pearson确定。得到各大题的区分度分别为:0.468、0.811、0.543、0.889。一般来说,难度大的题目,区分度较高;难度低的题目,很多学生做对,区分度必然低。从以上可以看出。
每大题与总分的相关系数较高,在0.01的显著性水平上相关。从上述数据分析可见,试题的区分度比较理想,且主观题的区分度优于客观题,这与主观题灵活的评分方式有关。
3 研究讨论与发现
3.1 考试的效度
效度是指考试的有效程度。把学生的平时成绩作为效度分析的效标,利用积差相关法求效标效度(Pearson法)。在SPSS中可以进行以下操作:分析相关双变量把学生平时成绩与考试总分选择入变量框中选择相关系数Pearson确定。得到本次考试总分与平时成绩的相关系数为0.966。说明平时成绩好的学生这次考试也好,平时成绩差的学生这次考试成绩也差,因此本次考试反映了学生的真实能力,符合要求。这与考题的区分度较高的测量结果一致,表明试题的质量较好。
3.2 考试的信度
信度是衡量一次考试的可靠性、稳定性的统计指标。在SPSS中可以进行以下操作:分析度量可靠性分析把分析量选入框中统计量选择同类相关系数确定。结果本次考试的信度为:0.765。一般来说,学校教师自编试卷的信度要求0.6以上,则本次考试卷子符合要求。这与考题的区分度较高的测量结果一致,表明试题的质量较高。但是信度没有达到0.8,影响信度的因素可能和评分、题量等有关。
从试卷的题型和分值比例可见,客观题分值不到主观题的一半,可能影响试卷的信度。从以上统计结果表明,主观题的区分度比客观题的高,证明高职电工应用技术考试中主观题的命题效果较好。另外,这次题目量较少,不少考生提前交卷,这也是影响信度的原因。再有,题目的知识覆盖面不够宽,这也是影响信度的原因。
3.3 班级差异性
在不很了解两个样本总体分布的情况下,一般用两个独立样本非参数检验,样本数大于30为大样本,用Kolmogorov-Smirnov 检验。用SPSS进行1班、2班学业成绩间均值的差异性检验。基本步骤:分析非参数检验两独立样本总分选择到检验变量列表中班级选择到分组变量框中定义组输入1与2继续选择检验类型确定。分析结果,1班46人,2班54人;K-S Z值为2.022,相伴概率为0.001<%Z=0.05,可以认为应该拒绝零假设H0,认为1班与2班学生的学业成绩均值存在显著差异。另外,在描述统计表明,1班的均值明显比2班高,差异显著,有高度的统计价值。
3.4 文理科学生成绩差异性
用以上方法可得到,高考文科考生与理科考生的差异性。分析结果:理科63人,文科37人;K-S Z值为1.914,相伴概率为0.001<%Z=0.05,认为高考理科与文科学生的学业成绩均值存在显著差异。另外,在描述统计表明,理科的均值明显比文科的高,差异显著,有较高的统计价值。
3.5 汉族与少数民族学生成绩差异性
用Kolmogorov-Smirnov 检验,基本步骤同上。分析结果:汉族60人,少数民族40人;最大绝对值差为0.100,最大正差为0.100,最大负差为-0.092,得到的K-S Z值为0.490,相伴概率为0.970>%Z=0.05,则不能拒绝零假设H0,认为汉族与少数民族学生的学业成绩均值无显著差异。
3.6 男女差异性检验
样本数小于30为小样本,用Mann-Whitney 检验。②分析结果:男生73人,女生27人;Z值为-0.074,相伴概率为0.941>%Z=0.05,则不能拒绝零假设H0,认为男女学生的学业成绩总体分布无显著差异。
4 结束语
4.1 试题方面
试卷的区分度、效度、信度较高,成绩频数基本趋于正态分布。题型多样,客观题与主观题比例基本合理;题量还可以加大一些,特别是加大主观题的量;知识覆盖面还可以加宽一些;今后按照题目的难度逐渐递增排列,以增加试卷的科学性;大多数学生两个小时完成为合适,重点考核学生基础知识、分析问题和解决问题的能力。
4.2 差异性检验
由班级差异性检验,推论1班、2班成绩存在显著性差异。产生原因可能与学习风气、试题难易等有关,还有待进一步研究。由高考文理科学生成绩差异性检验,推论文科生与理科生成绩存在显著性差异,产生原因可能与学生的数理基础有关。由不同民族学生成绩差异性检验无差异性,说明考试成绩与民族无关。由男女学生差异性检验无差异性,说明学生考试成绩与性别无关。
4.3 相关性分析
通过效度分析发现,学生学业成绩与平时成绩正相关。说明平时成绩的好坏直接影响学生的学业成绩。可能学生的学业成绩还与其它因素有关,如学习策略、生源地、家庭情况等,还有待进一步研究。
小学考试分析总结范文第4篇
考试是检查教学效果的措施之一,考试的目的在于使教师能随时了解学生的学习情况,摸清学习中尚存在的问题,以便教师改进教学方法,提高教学质量。 考试可以促使学生不断复习,巩固所学知识,培养学生努力上进、勤奋学习的好学风,训练学生独立思考的能力,以及增强对知识的辨别,推理和分析能力。在此,我不想谈通过考试,如何促使教师改进教学方法,提高教学质量,而想重点谈谈如何才能通过考试促进学生的学习,培养其各种能力。要想达到这一目的,学生必须注重对考试的总结。那么如何才能做好考试的总结呢?我认为应该做到: 一、明确目的 不少学生对考试没有正确的认识,把考分看作自己的命根儿。考得好的喜上眉梢,考得差的愁眉苦脸。故一考完试便将试卷扔在一边,或两把撕掉。这是一种极不正常的现象,这种现象表明学生对待考试的态度是不端正的,目的是不明确的。所以说,要想达到考试的真正目的,学生必须端正态度,明确对考试的认识。只有真正理解了考试的意识,才能通过考试,促进自己的学习。 二、分析试卷 有些同学认为只有没考好的同学才应该对考试情况进行总结。这是一种错误的认识。其实考试后的总结对每位考生来说都很重要。故每位考生在考试后都应该认真细致地做好试卷分析。那么,如何才能做好试卷分析呢?我认为要做好试卷分析,考生应该做到: 1.试卷上的每道题不是随便捡来的,而是通过命题人的深思熟虑选择而来的。每道题考查的目的都不同。故考生应该先弄清命题人的意图。如: The food ________ cool and clean. A. must keep B. Must keep C. must be keep D. Must be kept 一题,它的考查目的是要考查考生辨别语态的能力。如果考生能明确这一点,他们的思考范围就得到了限制,不会再像脱疆的野马,漫无目的。所以说,明确考查目的是解题过程中至关重要的一环。 2.明确考查内容 在确定了考查目的后,考生应该搞懂该题考查什么内容。当你明确了考查内容后,你的思考范围就进一步缩小,这对作对题是很有利的。我们还拿上一个题为例,根据该题的考查目的和句意,我们可以确定该题所考查的内容是被动语态。由此,我们可以看出,确定考查内容时,必须依据考查目的,语境和句意来判断。 3.回忆相关知识,做出选择 在明确了考查目的,考查内容后,我们就得根据考查内容,来回顾所学过的相关知识。如上述一题,我们知识它所考查的是被动语态。这样一来,我们就可以回忆自己所学过的有关被动语态的知识。如被动语态句式的结构,时态等。判断时态时,还要注意句子主语的数,确保主谓一致。一切考虑周到后,最后做到选择。 三、总结得失 通过分析试卷,考生应该达到总结考试得失的目的。通过分析,考生必须明确自己对课本知识的掌握情况。对于已经熟练掌握了的知识就可以放过去。如果对没有掌握了的,考生应在以后的学习中进一步反复学习,直至真正掌握。如前所给的那道例题,如果你做错了,那说明你对语态知识还没有掌握好。所以,你就应该对这部分的知识进一步的复习,真正弄清它的用法。如果在考试中单词拼写错误多,那么,你就应该加强对单词的记忆;如果你在阅读理解中出错多,那么,你就应该加强阅读训练。只有这样长期坚持,你的成绩才会逐步提高。你的能力才能逐渐增强,才能达到考试的真正目的。 四、总结考试的意义 总结考试对学生来说有着很重要的意义。 1.可以帮助学生提高学习的目的性,减少盲目性。通常,不少学生在考完试,不分析,不总结,所以,考完试后,他们学习中的问题出在什么地方,一概不清楚,也就不可能及时采取补救措施,改进自己的学习。还是糊里糊涂过日子,学成什么算什么。如果你经常注意总结,那么,你一旦发现问题,及时针对问题,采取切实可行的措施,过去存在的问题就会逐渐被克服。从而减少学习中的盲目性,提高目的性。 2.可以帮助学生养成良好的学习习惯。良好的学习习惯对学生来说是很重要的。印度有句谚语说得好:"播种行为,就收获习惯;播种习惯;就收获性格;播种性格,就收获命运。" 3.可以培养学生的综合素质 经常重视对考生的分析,总结,可以培养学生的分析问题、辨别事非、解决问题、归纳、推断的能力。在总结的过程中,必须对试题和试卷进行细心的分析,对有些知识必须进行辨析。通过分析,还需要总结、归纳出存在的问题,而在总结和归纳中,必须对情况进行推理,判断。而这些又能够构成一个人的综合素质。 由此可见总结考试不仅是非常重要的,也是非常必要的。这也是素质教育的要求。希望同学们不断学习,不断总结,不断进步。为把自己培养成具有多种素质的适应新形势要求的高素质人才而努力。
(延安中学 习若红)
小学考试分析总结范文第5篇
[关键词] 助理全科医师;试卷分析;信度;难度系数;区别度
[中图分类号] R-4 [文献标识码] C [文章编号] 1673-9701(2017)02-0125-03
Brief introduction to commonly used indicators of assistant general practitioner's examination paper
ZHANG Donghai1 ZHAO Liuzhuang2 GANG Jun3 XU Deying4 LIU Shuang3 MA Xiuhua2
1.Department of Gastroenterology, Daxing Hospital, Capital Medical University, Beijing 102600, China; 2.Office of Hospital, Daxing Hospital, Capital Medical University, Beijing 102600, China; 3.Department of Science and Education, Daxing Hospital, Capital Medical University, Beijing 102600, China; 4.General Practice and Continuing Education of Capital Medical Unicersity School, Beijing 100069, China
[Abstract] Eight indicators are used in evaluating examination quality, including reliability, validity, difficulty, discrimination testing and average marks, standard deviation, score distribution, grade. Commonly used methods for the above indexes which are suitable for general graduation examination paper analysis would be introduced briefly.
[Key words] Assistant general practitioners; Examination paper analysis; Reliability; Difficulty coefficient; Difference degree
试卷分析是针对大量的成绩数据进行统计、计算、分析,进而得出科学结论的过程。试卷分析属于“教育测量学”的范畴。通过试卷分析可能提炼出诸多对考试质量进行评价的数据,此时试卷就不是单纯地“考试”,而是变(升华)为“试卷分析”。通过试卷分析所得到的比较科学的分析结果,可以进一步展开对教学活动评价,了解教学质量以及学生的学习质量(如对知识的掌握程度)等[1-7]。评价考试质量常用8个指标,包括涉及试卷的信度以及效度、难度、区分度,还包括平均分数以及标准差、分数分布状态、成绩[8-10]。对于上述指标进行分析的方法学较多、有的较为繁杂。我们曾做过相应试卷分析工作[11,12],现结合工作体会将适合结业试卷分析的一般常用方法做一简介。
1 主要涉及试卷质量指标(信度、效度、难度、区分度)的一般分析方法[8,13-14]
1.1 试卷试题难度分析的常用具体方法
难度系数(P)通常是指试卷以及试题的难易程度,可以反映或评价大部分学生对该试题或试卷知识点的掌握程度。难度系数分析应该包括试题难度系数与试卷难度系数两部分,仅进行试卷难度系数分析不易找出具体问题(即总成绩可能掩盖具体得分点)。
1.1.1 试卷总体难度分析的常用方法 试卷整体难度一般以0.6~0.8为宜。方法1:难度系数(P)=试卷的平均得分÷该试卷的满分值。如:试卷平均分为75分,该试卷满分为100分,则P=0.75。该方法较为粗糙,故较少采用。方法2:试卷难度系数(P)=(考试成绩前27%学生的得分之和+考试成绩后27%学生的得分之和)/两组总人数满分之和(考试成绩前27%学生指考试成绩排名在前27%的学生,将这些学生的成绩相加即为得分之和;考试成绩排名在后27%的学员以此类推)。
1.1.2 试题难度系数(P)常用计算公式 方法1:难度系数=试题的平均得分÷该题的满分值。方法2:难度系数=该题的总得分÷该题的满分值。满分值是指:参加考试人数×该题卷面的分值。如果所有试题均采用1分制(即:满分100分,试题100道,每道1分;不采用扣分制),则该题得满分值就是参考人数。所得结果也是该题的答题正确率。此时用方法2就较为方便。
1.2 区别度分析的具体方法学
区别度(D)是指能够区分考试(测验)成绩好的学生和考试(测验)成绩差的学生的指标,一般通过计算高分数段和低分数段学生的难度系数而得出。要同时分析试题区别度数与试卷区别度,单独分析试卷区别度易于掩盖试题的区别指数,误导选用试题。区别度越高,区分能力越强。但是,在结业考试中允许D=0的试题出现。一般以
1.3 试卷信度分析的具体方法学
试卷信度(α)评价该试卷检测结果的可靠程度、可重复性的指标,即为评价被测者在测试中的实际测量值与真实能力是否一致性的指标。最好的试卷信度应该在0.9以上,若低于0.7以下则不甚可靠。计算方法如下。
1.3.1 克朗巴赫公式[Cronbach系数(α)] (α)= 试题数/试题数-1×[(所有被测者第i题的方差-所有被测者总分的方差)/所有被测者第i题的方差]。该方法适用于非选择题以及多值计分题(即:试卷试题的类型较多、各题分值不同,如包括多选题、是非题、问答题等)。计算过程较为复杂,需要每道试题计算后得出结果,该方法应用较多。
1.3.2 库德-理查逊信度(简化)公式 适合用于每题1分的选择题(即试题计分为1分或0分的试题)。信度系数=[n(s-1)2-X(n-X)]/[(n-1)s2](计算较为简单)。(n为卷面满分成绩,X为平均总分,s为标准差)[11]。该方法最大的好处是不需要逐题计算通过率。
1.3.3 库德-理查逊信度(简化)公式的进一步简化 计算较为简单。此公式适用于所有试题为每题1分选择题的试卷。信度系数=[K/(K-1)]{1-[X(K-X)/Ks2]}。K为测题的数目,X为平均总分,s为标准差)[5]。
1.3.4 相关系数(R)计算[10] 该方法计算较为复杂。具体公式可以参考相关文献。
1.4 试卷效度分析
效度用于评判测量的正确性、有效性(反映测量到的与所要测量的二者之间的符合程度)[5,6,8,14-15]。如果将测验总分看作是内部效标,则该测题的区分度也就是该测题的效度(即内部效标的效度)[5,6,8,14]。所以,如果仅分析试卷本身只要有区别度即可。因此,在多数的研究中没有计算“效度”[1,3,7,11]。其他获得效度的方法如下。
1.4.1 相关系数(R)计算 基本方法是通过计算两门性质相近学科、或同一学科前后两次考试成绩的相关系数(R)来评价此次考试成绩的有效性。
1.4.2 百分一致法 按考试成绩将学生分为高、中、低3组,用各个试题中高、低分组之差除以相应的满分,即可得出此题的效度值。这实际上雷同于“区分度计算”方式,仅适应于本试卷的检测[16]。
1.5 试题难度系数(P)与区别度(D)之间的关系
P值越大则说明试题难度越小(内容为多数学生掌握),P值越小说明试题难度越大(多数学生未掌握),此两种情况试卷或试题的区别度均较差;要有较好的区别度,试题难度应适中。
较易试题的难度系数≥0.7;0.4
2 主要体现学生成绩的分析指标(成绩、平均分数、标准差、分布状态)[5,6,10,13,14]
2.1 成绩
即考生试卷的总得分。这是基本原始数据,是所有数据分析的基础数据,必须仔细输入。
2.2 平均分数
是最直观的集中量数。一般认为平均分数的最佳数值为75(百分制)。
2.3 标准差(s)
例如,甲班与乙班的考试平均分数相近但分数分布差异明显,则不能说两个班级的成绩相近。此时不仅要考虑到平均分数,还要计算分数的离散程度(简单可以理解为“分数分布情况”,学术名称――差异量数)。常用的差异量数有多种,经常采用的差异量数是标准差。计算公式可以在统计学教材查找到。计算标准差,理论上讲学生人数越多越好。一般认为:标准差≤10即能符合要求。标准差过大说明全班分数差异过大,需要教师予以注意;但过小则信度下降,区别度下降,标准差也可用于信度计算。
2.4 分布状态
简单理解就是看整个班级(年级)学生的成绩分布情况。一般要求是正态分布,结业考试可以允许一定的正偏态分布,但绝不能完全一边倒。一般习惯是利用成绩分布曲线分析学生的考试成绩(纵坐标为学生人数,横坐标为分数),可以直观的下结论(定性分析);如果要进行定量分析,则需进一步计算偏态量数及峰态量数[10]。
试卷分析的方法学较多,本文仅介绍较为简单、易于掌握的部分。利用试卷分析结果,可以评价教学效果,但其评价的基础是要有高质量的“试卷”(难易程度适当、知识点掌握的较好),这同样涉及教与学两方面的努力。试卷分析仅仅是手段而已,也可称为是教育测量的工具。在进行试卷分析的准备过程中,首先要编制适合测试对象的“试卷”:编制试卷则要根据测验目的进行,最基本的是要依据测验功能决定是进行能力倾向测验(学生的潜在能力如何?)是学业成绩测验(考察学生经过教育教学过程后学业成绩的掌握情况,也称“考试”)。进一步,则要根据培养目标进行分数解释,如果是“目标参照性测验”则其及格就是最基本的教学要求水平参照点,分数愈高说明达标的完满程度愈高;如果是“常模参照性测验”,即测验目的是鉴别性测验(优选,如高考),则测验的难度就要适当增加以利于选拔。结业测验一般是“目标参照性测验”,本文介绍的简便方法学适用于“目标参照性测验”。
研究结业考核标准与模式是不断探讨的课题[17],结业试卷分析不仅可以评价本次考核内容的学生掌握情况、教师教学效果,同时也可以评价不同教学单位在教授同一课程时其间教学效果的差异性[18]。“3+2”助理全科医师培训[19-21]是一项新的工作,我们在其中的《临床综合课程》教学实践、教学管理中,纳入试卷分析体系作为评价整体教学水平、发现不同教学单位教学差异点的手段之一[8,9],取得了较好的效果,不仅了解了教学效果,同时也为提出新的教学思路提供启发点,为集体备课提供了具体依据。因此,掌握试卷分析方法学,既是教师的基本功(特别是高校教师),也是教学管理部门应该熟悉的管理内容与管理技术。
[参考文献]
[1] 张正祥,刘国庆,王廷慧,等. 延安大学医学院药理学试卷分析[J]. 中华医学教育杂志,2008,28(4):120-122.
[2] 孙敏,王锦帆,祖勤,等. 医学生学习中期评估测试实效分析[J]. 中华医学教育杂志,2013,33(4):617-620.
[3] 卢燕,王培玉,刘宝花. 北京大学医学部八年制疾病预防医学期末考试试卷分析[J]. 中华医学教育杂志,2013, 33(5):791-793.
[4] 和永祥,王渊,徐俊丽,等. 内科学考试试卷分析与评价[J].西北医学教育,2006,14(3):304-305.
[5] 王孝玲,教育测量(高等师范院校教材)(第2版)[M]. 上海:华东师范大学出版社,2005:1-188.
[6] 黄颖,林端宜. 试卷分析研究现状综述[J]. 西北医学教育,2005,13(1):39-40.
[7] 宋青,蔡景一. 试卷考核质量评价[J]. 中国高等医学教育,2006,(11):30-31.
[8] 高卫红,任俊峰. 利用教育统计学原理进行考试质量分析方法初探[J]. 武警医学院学报,2004,13(3):214-218.
[9] 田考聪,彭斌. 试卷质量定量分析系统中的几个参数及其应用[J]. 医学教育探索,2004,3(4):52-54.
[10] 张玲玲,梅忠义. 对学生成绩评价指标体系中一些问题的思考,合肥工业大学学报(社会科学版),2006,20(2):19-21.
[11] 马秀华,张东海,黄东明,等. “3+2”助理全科医师培训《临床综合课程》结业试卷评价及相关因素分析[J]. 中国医学教育技术,2015,29(2):213-217.
[12] 马秀华,张东海,徐德颖,等. “3+2”助理全科医师培训中《临床综合课程》结业试卷分析评价[J]. 中华医学教育探索杂志,2016,15(5):445-450.
[13] 彭斌. 试卷质量定量分析系统中的几个参数及其应用[J].中华医学教育探索,2004,3(4):52-54.
[14] 刘新平,刘存侠. 教育统计与测评导论(第1版)[M]. 北京:科学出版社,2003:133-156.
[15] 史宏灿,龚卫娟,郑英,等. 以国家执业医师资格考试为参照的临床医学教学改革思考[J]. 中华医学教育探索杂志,2016,15(5):459-464.
[16] 陈欣,戴社教,赵暹,等. 不同类型试题对医学影像学考试评价的效能分析[J]. 中华医学教育探索杂志,2016, 15(5):455-458.
[17] 赵丽莉,李崭,黄艳. “3+2”培训项目结业考核标准与模式的研究[J]. 继续医学教育,2015,29(11):4-5.
[18] 张东海,马秀华,赵留庄,等. 通过临床综合课程结业试卷分析不同教学单位教学效果的差异[J]. 卫生职业教育,2016,34(12):101-103.
[19] 黄艳,线福华,赵丽莉,等. “3+2”助理全科医师培养模式的探索与实践[J]. 中华医学教育杂志,2014,34(2):31-33.
[20] 张东海,马秀华,黄东明,等. “3+2”助理全科医师培训首轮课程施后的思考[J]. 中华医学教育探索杂志,2015,14(8):837-840.