首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
绝对评价法     
近几年来,时代对教师提出了更高的要求,教育行政部门先后根据教学大纲、教材对教师的要求,统一命题,进行了教材教法过关考试和专业合格证考试和考核,试题按教学目标选定,利用标准参照进行测验,这种对教师达标程度的考试和考核就是绝对评价。绝对评价,就是对照各门学科的教学目标,表明教学水平和成败的方法,它所揭示的是一个教师在指定的教学指标体系内达标程度、存在问题以及他面前还有那些困难,而不是他与同行集体比较所占的位置如何。因之,绝对评价也称标准参照评价。对教师进  相似文献   

2.
一、什么是英语标准化考试考试的种类和名称很多,都是从不同的角度来说的。从解释分数意义的参照标准来说,考试一般可分为三类:(1)常模参照考试;(2)目标参照考试;(3)潜力参照考试。英语标准化考试就是一种单科的常模参照考试,这里所讲的英语是指外语而言,所讲的考试包括测验在内。凡标准化考试都必须提供常模。常模是教育测  相似文献   

3.
高等教育自学考试试卷平行性及其评价维度初探   总被引:1,自引:1,他引:0  
高等教育自学考试是一种典型的标准参照测验。试卷的平行性可以界定为相同专业下同一课程的不同试卷在形式、内容、功能和分数结果上的一致性和可比性,它对自学考试的科学性和有效性具有非常重要的意义。对自学考试试卷平行性的度量和控制,可以从试卷结构、题目内容、题目功能和结果数据四个方面进行。  相似文献   

4.
引言近年来,随着考试科学的不断发展和高考标准化的推广与实施,常模参照测验理论已被大多数考试工作者所熟悉。但是对标准参照测验理论与技术却显得非常薄弱,特别是在目前,校内考试、自学考试、高中毕业会考、各种证书考试蓬勃发展的时  相似文献   

5.
各国大学入学考试有的属于常模参照测验(选拨性考试)有的属于标准参照测验(水平性考试),有的兼有两种测验的特点。我国普通高等学校招生全国统一考试(一般简称高考)属于典型的常模参照测验。本文拟以我国高考为主要对象探讨常模参照测验类型的大学入学考试各科目成绩相加的含义与存在加法运算的充分必要条件。文章不涉及考试方案的设计、试卷的结构、命题、题目赋分等,并假定上述工作已取得理想成果。  相似文献   

6.
随着国内外教育测量理念的转变,传统的常模参照测验所提供的相对性评价信息已无法满足考试用户和考生的需求,标准参照测验(CriterionReferenced Test,CRT)的社会价值越来越受到重视。在对被试掌握程度进行分类决策的CRT测验中,如何确定恰当的测验长度和合格分数是影响测验分类误差的重要因素。本文在对CRT测验研究的现状、原理和用途进行考察的基础上,专门介绍了二项式概率模型在CRT测验长度决策研究中的理论和过程,并以误差控制为原则,对二项式模型在综合性标准参照语言测验长度和合格分数决策中的应用过程进行了研究。  相似文献   

7.
本文通过标准参照测验的研究,以编制标准参照测验的理论为依据,以项目反应理论指导,结合操作系统的考试科目给出了标准参照测验的编制过程。  相似文献   

8.
作为有别于常模参照考试的学期段考,这份语文试卷属于典型的标准参照考试.所谓常模参照考试是以测量学生在一个特定群体中的相对水平为目的,而标准参照考试则是以具体的教学目标为标准,测量学生是否达到教学目标以及达成度如何①.因此,这份试卷在提示语中开宗明义地说道:"我们希望通过以下一些题目了解一下你的学习成果和教师的教学成果."这样,学生一拿到试卷就立即处于"考试"和"非考试"之间."考试"毕竟是考试,是对自己这一段的语文素养的检测,还是不可等闲视之;而"非考试"则说明此次测验不是甄别、选拔和从高分到低分的排队,也就没有那么大的心理压力,相对来说可以以平和的心态做题了,容易考出自己的真实水平来了.  相似文献   

9.
全国计算机技术与软件专业技术资格(水平)考试属于目标参考性测验,但又具有常模参考性测验的特点,以此为出发点,本文从测量误差模型出发,分析并提出了一套计算机软件考试的质量评价指标,这些指标包括测验效度、信度、难度、区分度等,并以经典测验理论为基础,提出了一套有效的、可操作的计算方法。质量评价结果对于指导命题、改进教学、完善考试大纲、合理评价人才具有重要意义。  相似文献   

10.
确定行业资格考试的合格标准   总被引:2,自引:0,他引:2  
1 问题的提出合格标准(又称分界标准或及格分数)的确定是标准参照测验中一个极为重要的理论和技术问题。行业资格考试属于典型的标准参照测验,其考试目标就是有效估计被试的知识与技能水平,并与合格标准进行比较,从而对被试的从业资格做出判断和决策。从技术上讲,合格标准又是后期统计分析的基础和前提,没有一个科学、有效的合格标准,行业资格考试的各种技术和政策问题都难得到合理解决。  相似文献   

11.
高中地理会考是国家承认的省级普通高中学业成就考试,属于以标准参照为主的终结性测验。主要任务是考核学生地理课程的学业是否达到了高中毕业的标准。它涉及考试目标的制订、命题、考试实施、成绩评估等一系列环节,其中命题是整个会考工作的核心环节。而对于命题来说,...  相似文献   

12.
阅读理解能力测验中所选择的文章在内容方面对不同专业背景的考生亚团体是否具有公平性的问题,是测验效度高低的重要证据,也是测验效度验证(validation)的重要环节。本研究以中国语言与文学专业考生为目标组,分别将经济学专业和生物医学专业考生作为参照组,采用效标测量和蕴涵量表分析相结合的方法,对HSK(高等)阅读理解测验的文章难度对三个不同专业背景的考生组的公平性问题进行了检验。研究结果表明,两个参照组考生尽管具有各自的相对专业优势,但他们在六篇阅读材料上获得的难度排列顺序与目标组考生完全一致;虽然目标组考生不具备汉语知识以外的其他专业优势,但因为HSK考试所选择的阅读材料没有涉及语言知识本身以外的特殊专业要求,因而测验对三个不同专业背景的考生具有较高的公平性。  相似文献   

13.
测验无障碍性是指施测过程中考生与题目的恰当交互,是保障测验不受无关变量干扰、有效测量到目标构念的必要条件。测验无障碍性是残疾人接受测验时需要考虑的重要因素,美国教育考试服务中心(ETS)作为国际专业考试机构的代表,提出了测验无障碍性的概念及测验无障碍性提升策略,通过制定测验无障碍性准则对测验开发全过程进行无障碍性控制。ETS的无障碍测验开发经验值得我国教育考试机构借鉴与参考。  相似文献   

14.
近年来,我国标准化考试的研究方兴未艾,但正如某些专家讲的那样:国内发表的有关研究教育测量方法和技术的文章较少联系相对测量和绝对测量利弊,只是介绍某种测量技术,而不把它置于相对测量和绝对测测量领域中探讨,这样极容易产生误解.基于这种事实,本文就从理论上探讨一下常模考试和目标考试的地位,从而明确二种考试的关系.一、常模考试与目标考试考试既可以衡量学生的相对水平,又可以衡量学生的实际水平,我们把用于衡量学生相对水平的测验称常模参照测验(Norm Referenced Test),用于衡量学生实际水平  相似文献   

15.
新课标实施以来,采用试卷的形式进行的纸笔测试,依然是目前评价教学质量的主要标准之一.这类测试主要包括各类单元考试、月考、期中考试、期末考试等目标参照测验,并由学校教师仿照标准化测验模式自行设计编制,能够满足教师的教学需求.本文结合学生的心理活动规律,明确影响试卷编制质量的因素,依据标准化试卷命题原则编制标准化物理试卷.  相似文献   

16.
在经典测验理论中,试题难度P是以考生得分率来评定试题难易程度的指标。自学考试、高中毕业会考等性质上属于标准参考性考试,其特点是根据各科教学(考试)目标的要求,制定考试标准,通过测验衡量考生是否达到标准。这类考试试题难易度的概念应当主要体现教学目标的要求,要求高的是难题,要求低的是易题。考试试题难易分布的不同,影响到多个方面,它可以影响到考生的得分率、试题的重点和难点、教学目标的要求等。可见,标准参考性考试试题难度的分布应加以重点研究,它对题库建设具有重要的意义。本文提出了题库试题抽取的难度概率模…  相似文献   

17.
效度是衡量考试科学性的重要指标,反映考试在多大程度上实现了测量目的;效度验证也成为测验开发的重要环节,用以支持分数解释及测验使用。本文简要介绍了效度概念的内涵及效度验证的发展历程,并尝试将效度整体观引入自学考试领域,对自学考试的效度验证及其证据来源进行初步探索。本文提出,自学考试应从命题管理的各个环节系统地收集证据进行效度验证,效度证据的来源包括测验内容、反应过程、测验内部结构、测验评分、跟外部变量的关系、测验后果等多个方面。  相似文献   

18.
科学、客观、可行的评价指标体系,是得到科学、客观、公正的评估结论的基础.基于元评价的视角对评估指标体系的可靠性和有效性进行分析,若评估指标所反映的内容不在同一目标上,说明有部分评估指标偏离了评估目标,即评价目标与评估指标的一致性较差,导致评估指标体系的稳定性较差.在对指标体系有效性分析的基础上,若某些末级指标处于相同的结构状态中,则可认为这些指标是整个指标体系中最为合理的指标;若某两个指标被纳入同层结构,但归为不同的二级指标,表明这两项指标具有分散的特征.  相似文献   

19.
如何确立标准参照测验中的合格分数是涉及到测验公平性的一个技术问题,介绍与之相关的经典测验理论(CTT)下的被试组对比判断法、测验内容分析判断法,项目反应理论(IRT)指导下的确立方法等,以期对广大考试工作者有所借鉴与启示。  相似文献   

20.
测验等值使得不同形式的考试能进行比较,从而保证了测验之间的相对稳定性。基于IRT的分数等值是在估计出参数的基础上进行的参数转换,等值结果的稳定性与考生样本量密不可分。本研究针对汉语水平考试(HSK)阅读分测验,采用真实数据模拟共同组锚测验设计,确定等值的参照标准,考察考生样本量的变化对IRT分数等值稳定性的影响。结果表明,考生样本量为2000左右时各种方案的等值结果均比较稳定。考生样本量进一步增大时,等值误差不降反增。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号