首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
该研究运用经典的安哥夫标准设定法为新理念大学英语网络教学系统的单元测试设定分界分数,从北京、上海、深圳、重庆四地挑选了40位专家参与研究。在标准设定过程中采取一系列措施把误差控制到最低。通过对专家们得出数据的计算和分析,该研究确定了单元测试的分界标准。  相似文献   

2.
旨在综合应用现代测量理论分析我国现有初中学业水平考试中固定分数法标准设定的信度指标。采用分层随机取样设计,分别从我国东中西部地区各选择一个区县,并分别从中随机抽取初三学生3000名,对被试的数学学业水平考试的数据进行分析。综合应用现代测量理论分析学业水平考试标准设定的信度指标,包括经典测量理论的决策一致性系数(kappa)、概化理论的等级线决策信度Φ_λ和项目反应理论的信息量I_θ。研究结果显示,固定比例法标准设定下,决策信度处于0.7左右;等级线决策信度大于0.7,大部分在0.8左右;分界点的信息量大部分低于16。这些结果说明,我国现有的学业水平考试标准设定质量一般,对于毕业和升学的高利害性考试来说需要进一步提高。  相似文献   

3.
标准设定:步骤、方法与评价指标   总被引:1,自引:0,他引:1  
李珍  辛涛  陈平 《考试研究》2010,(2):83-95
标准设定(standard setting)是划分标准的过程,指在测验分数分布中划分出两类或两类以上的分界分数。通过标准设定,考生可以被分为“通过”和“未通过”,或者是被分为更多的有序表现类别。标准设定是标准参照测验的重要组成部分,也可为测验决策者提供关于测验效度的依据,是目前测量领域一个颇受关注的研究问题。本文首先回顾了标准设定的源起和发展历程,然后详细地介绍了标准设定的基本步骤和几种主要的标准设定方法,评估标准设定过程的指标,最后简单论述了在国内各类考试中应用标准设定的必要性。  相似文献   

4.
基于项目反应理论中的LOGISTIC双参数模型研究共同题非等组设计下,考生能力分布与被试量对等值的影响。等值方法采用分别校准下的项目特征曲线法、Stocking-Lord法、Haebara法。等值结果采用等值分数标准误、等值系数标准误、共同题参数稳定性三种方法进行评价。研究结果表明,考生能力分布越接近,被试量越大,等值误差越小;且Stocking-Lord法较Haebara法的等值结果更稳定。  相似文献   

5.
本研究由12位专家参与,使用修订式Angoff法对接2016年江苏省高考英语阅读和中国英语能力等级量表,包括四个步骤:熟悉阶段、考试说明阶段、标准设定阶段和效度验证阶段,并采用多层面Rasch模型分析专家判断的一致性。结果表明,专家判断具有良好的外部一致性,江苏省高考英语阅读对应量表四级,原始分的分界分数为58.9%。研究最后对于对接量表实验进行了分析和总结。  相似文献   

6.
李潇  陈平 《中国考试》2023,(9):52-59
问卷法作为主流的实证研究方法被广泛应用于教育评价领域,其使用的变量合成与分数切分点计算方法直接关系到测评结果的科学性和解释力。目前,PISA、TIMSS和PIRLS等国际大规模测评项目主要采用基于项目反应理论的量尺化方法合成变量,应用分数链接技术将趋势量表分数转换到基准量尺,实现不同测验周期的测评结果可比。另外,TIMSS 2019在充分运用Rasch簇模型性质的基础上,根据专家评定的反应类别组合来确定分数切分点,而PISA 2018则基于被试在群体中的相对位置确定切分点。  相似文献   

7.
我国基于标准的教育考试的分类标准比较混乱,存在诸多争议。Bookmark法最早是由Mitzel等在2001年进行系统描述的基于项目反应理论的设置标准等第划界分数的方法,近年来在国际上得到越来越广泛的应用。文中先介绍Bookmark法标准设置的基本原理,以及执行Bookmark法的基本程序。然后,以高等教育统考课程《高等数学》为例,在考后利用Bookmark法进行标准设置,确定优、良、合格和不合格四个等第的划界分数。  相似文献   

8.
基于项目反应理论的Lee分数分类方法对高考改革试点省市两种等级赋分方式的分类一致性和准确性进行研究。发现在IRT模型下,分类一致性和准确性指数受等级数量、划界分数位置、测验分数分布等因素影响,分数分类的一致性和准确性随分数等级数量的增加和分数向等级临界点靠近而呈现降低的趋势,随分数远离分数密集区域和分数远离测验均值而呈现增加趋势。建议后续改革省市在设定等级时,保持适中的等级数量,根据分数分布设定划界分数,试题命制应充分考虑考试的分数分布。  相似文献   

9.
目的:尝试在项目反应理论的指导下,编制四年级数学成就测验,为学科评价提供辅助工具.方法:用贝佳访法检验试测数据的单维性,利用ANOTE软件估计项目参数,用基于题目分类下的经验判断法建立一个划界分数,再接合项目信息量和双向细目表编制成卷.结果:四套试卷均符合单维性要求,基本拟合三参数逻辑斯蒂克模型,项目拟合度都在85%左右,最终选取141个信息量高的项目组成正式题库,精选50个项目组成四年级数学标准参照测验.  相似文献   

10.
在同一次测验中,对于不同能力的被试,其能力分数的估计误差也是不相同的.能力分数除了具有测验分数的直观意义外,它还具有以下特征:能力分数是"不变分数";能力分数是相合估计;能力分数呈正态分布.将不变分数概念和项目反应理论结合起来应用于学生的学业成就评价,可有效克服测验分数的固有缺陷.  相似文献   

11.
基于项目反应理论的测验编制方法研究   总被引:3,自引:0,他引:3  
本文在简单介绍项目反应理论的基础上,从计量分析的角度,深入探讨了应用项目反应理论编制各种测验的一般步骤;探讨了项目反应理论题库建设方法及基于题库的测验编制方法;探讨了标准参照测验合格分数线的划分方法。  相似文献   

12.
项目反应理论(Item Response Theory,IRT)是现代教育心理测量领域中最有影响的一种测量理论,它的一个明确目标是扩展模型的种类以至于能够处理实际测试中任何形式的反应数据。在已有的各种模型研究中,对于多级评分项目,只考虑到项目区分度和难度。但在实际测验中,此类项目还可能存在猜测度。本研究基于Samejima等级反应模型,将项目猜测度融合到多级评分模型中,提出了三参数等级反应模型(Three-parameter Graded Response Model,3PL-GRM)。由于忽略多级反应项目的猜测度会使得该项目的信息量虚假升高,本研究还进一步将3PL—GRM的信息函数应用到试卷质量分析中。  相似文献   

13.
采用认知诊断模型分析182位小学生的分数运算能力。通过对认知诊断模型中的G-DINA和DINA模型进行比较和拟合,发现DINA模型更适用于本次测验,拟合的结果较好(RMSEA=0.054);测验的难度和区分度均达到项目反应理论所需的要求。学生掌握属性A1、A2、A3、A5、A6的比例大约0.9,A4掌握的比例只有0.7789,全部掌握分数运算属性的比例为68.53%。认知诊断模型将为改进学生学习、提高教师教法提供理论和数据支持。  相似文献   

14.
张鑫  姚瑶 《青海教育》2023,(Z1):90-91
微项目学习以课程标准为依托,围绕2—3个学科重要概念和原理设定学习项目,将项目细分后进行课堂教学,既保留了项目化学习的优势,又克服了项目化学习时间长、跨度大、评价难等弊端,更适合基础教育阶段学科教学。本文以“光合作用与能量转化”为例,探讨了微项目学习模式在高中生物学教学中的实施策略。  相似文献   

15.
<正>《数学课程标准(2022年版)》提出:“综合与实践主要包括主题活动和项目学习,第一、第二、第三学段主要采用主题式学习,第三学段可适当采用项目式学习。”并对主题活动和项目式学习提出了总体要求:“在主题活动中,学生将面对现实的背景,从数学的角度发现并提出问题,综合运用数学和其他学科的知识与方法,分析并解决问题。”“项目式学习的设计以解决现实问题为重点,综合应用数学和其他学科知识解决问题,体会数学知识的价值,以及数学与其他学科的关联。”从以上表述来看,《数学课程标准(2022年版)》对主题活动和项目式学习的定位比较清晰,  相似文献   

16.
一、作为方法论的证伪与作为教育实验结果的证伪 1.作为方法论的证伪关于科学与非科学的分界标准,一直是科学哲学中的一个重要问题。逻辑实证主义者的分界标准是证实原则,波普尔的分界标准是证伪原则,而库恩的分界标准是“范式”原则,那卡托斯则认为分界标准应是预见性原则。波普尔认为,理论虽然不能为经验所证实却能被经验所证伪,“作为划界的标准不是可证实性,而是可证伪性”,“应当把理论系统的可反驳性或可证伪性作为分界的标准。”他所理解的是实验对理论的证伪。那卡托斯认为,实验本身并不具有证伪的资格,而只是通过新理论的证伪才反驳、证伪旧理论。并指出“任何理论都能够导致新事  相似文献   

17.
信度计算是近年来语言测试理论界的一个研究亮点。本文介绍了Bachman有关语言测试计算方面的三种理论模式,即:CTS-理论(传统真正分数计算理论)、G-理论(综合归纳理论)和IR-理论(项目反应理论),并对上述三种模式的优、劣势进行了简单分析。  相似文献   

18.
一、用图示法解题 例1 将一定质量的汉白玉粉(主要成分碳酸钙的质量分数为90%)与镁粉混合,在空气中加热至反应完全(杂质不参加反应),测得反应前后固体质量不变,求原混合物中汉白玉粉的质量分数?  相似文献   

19.
如何确立标准参照测验中的合格分数是涉及到测验公平性的一个技术问题,介绍与之相关的经典测验理论(CTT)下的被试组对比判断法、测验内容分析判断法,项目反应理论(IRT)指导下的确立方法等,以期对广大考试工作者有所借鉴与启示。  相似文献   

20.
尽管科学本身已逐渐具备了强大的自组织能力,但对科学分界问题的思考与研究不论在理论层次上还是在实践层次上仍都具有现实意义。一种将分界标准与充分条件和必要条件联系起来的研究方法无疑增加了科学分界的逻辑严密性,但这种尝试因其本身的缺陷并没有更好地解决科学分界的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号