期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈富国李伟明《江西师范大学学报(哲学社会科学版)》1987,(2)

七十年代以来,项目反应理论(ItemResponse Theory,IRT)成了测量专家关心的主要课题之一。IRT中单参数Log-istic模型常称为Rasch模型,它是由丹麦数学家Georg Rasch沿着与其他项目反应模型非常不同的路线推导出来的本文旨在介绍Rasch模型在实际中的一些应用和一种模型参数的估计方法。这种方法可以借助于手算完成,从而使普通中学老师也可以作一些IRT的题目分析工作。一、模型及其应用IRT理论认为,潜在能力测量模型至少应该包括被测对象(考生)的行为反应与潜在能力的度量。前者是可观察的,后者是待估计的。Rasch模型可以表示为相似文献

2.

以多面Rasch模型测量写作能力

George Engelhard Jr. 《教育与考试》2007,(4)

本研究的目的是描述一个用于测量写作能力的多面Rasch(FACETS)模型。该FACETS模型是Rasch测量模型的多元变量拓展,它可为写作测评中的校标评分员和写作题目提供框架。本文展示了如何应用FACETS模型解决大型写作测评中遇到的测量问题。参加全州写作考试的1000个随机抽取的学生样本被用来显示该FACETS模型。数据表明即使经过强化训练,评分员的严格度有显著区别。同时,本研究还发现,写作题目难度的区分,虽然微小,却具有统计意义上的显著性。该FACETS模型为解决以作文测评写作能力的大型考试遇到的测量问题提供了一个有前景的途径。相似文献

3.

混合Rasch模型及其在项目功能差异分析中的应用

王立君黄明明《教育测量与评价(理论版)》2015,(5)

Rasch模型是单参数Logistic模型,也是最简单的IRT模型,它与潜在类别模型相结合便形成了“混合Rasch模型”(MRM),目前已提出了二级计分模型、多级计分模型和多水平模型等表达式.MRM的参数估计研究通常涉及参数估计和模型评价两大基本过程,其中MCMC算法的应用最为常见.由于MRM在检测项目功能差异方面具有独特的优势,其原理简单明了,因而其研究和应用得到广泛认可.不过,MRM的提出与发展虽然弥补了传统IRT模型的相关缺陷,但其理论及其用于项目功能差异分析的研究空间还非常大.研究者有必要进一步加强MRM的理论研究及其用于项目功能差异分析的研究,在拓展其应用研究领域的同时,本土化研究问题也必须考虑进来. 相似文献

4.

Rasch模型及其在香港中学会考水平参照等级评定中的应用

罗冠中《考试研究》2008,(2):18-32

由2007年开始,香港中学会考中国语文科及英国语文科采用了水平参照模式(standards-referenced reporting)对考生的成绩进行等级评定。在分数处理过程中,采用了含结构参数的Rasch模型。本文介绍了该模型及其一些主要性质,导出了联合极大似然估计(Joint Maximum Likelihood Estimation)的求解方程,并报告了应用该模型于香港中学会考水平参照等级评定中的主要结果。相似文献

5.

Rasch模型项目参数不变性的验证研究

李付鹏宋吉祥杜海燕《教育测量与评价(理论版)》2019,(1):18-24,39

Rasch模型具有被试参数和项目参数相互独立的性质,即被试能力与项目难度无关。本研究以某年度大学入学考试数学学科的实测成绩数据为例,在随机抽样、不同性别抽样、不同水平群体抽样等条件下,对Rasch模型项目参数不变性进行了验证研究。研究表明:Rasch模型项目参数不变性验证的前提条件较为严格,需要排除诸多干扰因素的影响;Rasch模型项目参数不变性的验证存在一定的误差,无法实现与理论一致的"不变性";Rasch模型项目参数不变性没有统一的标准,需依据实际问题确定。相似文献

6.

基于Rasch模型的语文学科能力评价研究

关惠文《现代企业教育》2014,(20):481-481

在学科教学中,发展学生的学科能力是一项重要的目标,因此,有必要开发测试工具检测学生的学科能力。本研究结合心理学理论和语文学科特色,对语文学科能力进行了基于学习理解、实践应用和创造迁移三个能力层级的划分和描述,以北京市10所中学1679个样本进行测试,基于Rasch模型,着重探讨根据学生能力表现对测试工具进行检测与评估。相似文献

7.

基于Rasch模型的题库维护技术研究

刘奕轩姚建欣《中国考试》2023,(4):68-77

随着教育评价理论的发展和信息科技的进步,题库建设愈发强调试题存储、管理和调用的动态过程。在这一动态过程中,按照什么标准和程序检验、添加新试题是题库维护工作的重要议题。以某学科学业能力测评的题库维护为例,使用基于Rasch模型的链接测评技术和题库维护方案,选择链接设计后重组题库,通过分析新、旧题库的试题所考查的能力维度、难度指标、功能差异等评估链接质量,将检验合格的18道试题存入题库。基于Rasch模型的题库维护方案提供了一套较为系统的工作程序和检验指标。相似文献

8.

基于Rasch模型的参数估计方法比较研究

《中国考试》2017,(9)

本研究的目的是基于Rasch模型,比较联合极大似然估计法、边际极大似然估计法和EM算法、边际贝叶斯估计法参数估计结果的准确程度。实验数据为2 185名被试在HSK试卷170道试题中的作答矩阵,考虑到初值和收敛精度对参数估计结果的影响,将三种参数估计方法按照初值设置和收敛精度不同分别进行参数估计,然后通过计算项目参数估计标准误判断参数估计方法的准确度。相似文献

9.

Rasch模型在研究生入学考试质量分析中的应用 总被引：1，自引：0，他引：1

赵守盈何妃霞陈维罗杰关丹丹《教育研究》2012,(6):61-65

运用Rasch模型对2010年全国硕士研究生入学考试心理学专业基础综合考试进行分析。结果表明,该试题总体上是一套高质量的测验,试题的内容覆盖了所有能力水平的考生,且能够较好地区分考生的能力水平,达到了预期的选拔目的。但通过Rasch分析也发现,在试题中有个别题目没有达到预期的测量目标,可以考虑在今后的工作中对其做出相应的修改。基于Rasch模型的试题分析能为考生能力和试题质量分析提供更多的测量信息。相似文献

10.

基于Rasch模型的初中化学素养表现性试题研究

夏振洋刘开福王后雄黄勇《教育与装备研究》2023,(5):47-52

课程标准是教师教学实施和考试评价的依据。研发测评试题在素养进阶的过程中有重要的意义。该研究的目的是采用项目反应理论研制初中生化学素养的测评试题,为加强素养进阶的实证研究、应用研究提供参考。研究过程为：基于义务教育化学课程标准(2022年版)质量要求研制中期调研试题测评试题,研究问题、通过500个被试样本从项目一致性、单维度、项目-被试对应分析、拟合程度等多维度数据分析、拟合性较差试题项目分析,得出结果表明：在新课标颁布初期,初中生化学素养进阶与学业质量符合预期,通过表现性诊断报告为了解学生个性化发展、改进教学提供科学工具。相似文献

11.

基于Rasch模型的高考数学性别DIF检验

《中国考试》2019,(3)

利用基于Rasch模型的DIF检验方法,对近10年高考数学106道选择题进行性别DIF检验,得出有利于男生的试题有55道,有利于女生的试题有51道,在14道中度和重度以上DIF试题中,各有7道题分别有利于男生或女生,因此可以得出试题在总体上没有较大的性别差异;再通过对14道具有中度和重度以上DIF试题考查的内容和能力进行分析得出,男生在空间想象能力方面具有一定的优势,女生在计算能力方面具有一定的优势,造成差异的原因除与试题特征(考查的内容和能力)有关外,还可能与考试过程中的心理因素有关,需要综合考虑多种因素并加以验证。相似文献

12.

在EXCEL中应用Rasch模型计算题目难度

王生军《安徽广播电视大学学报》2004,(3):120-123

应用Rasch模型计算出来的题目难度值与被试样本无关,是题目的一项最重要的量化指标.Rasch模型的题目难度的计算在EXCEL程序中能很方便地完成,本文介绍了详细的计算步骤,并讨论了怎样用题目难度值来估算考生的能力水平. 相似文献

13.

基于Rasch模型的化学平衡诊断工具的开发

周莉敏任红艳《化学教与学》2019,(11)

相似文献

14.

基于Rasch模型的中学化学守恒观测评研究

王禹超陶勇陕光王后雄《化学教学》2020,(6):26-32

相似文献

15.

多面Rasch模型在英演讲比赛中的应用研究

张冰《高考(理化生)》2013,(9)

针对影响演讲比赛打分结果的各种误差来源,本文引入多面Rasch模型对评分进行分析。此模型在分析评分结果中的应用不但有利于有效测量考生的能力水平,而且为识别问题评委、完善评分规则、及评委培训等问题都提供了全新的解决思路。本文同时也介绍了多面Rasch模型的理论及其在演讲比赛评分中的应用框架。相似文献

16.

多面Rasch模型在主观题评分培训中的应用 总被引：7，自引：2，他引：7

李中权孙晓敏张厚粲张立松《中国考试》2008,(1):26-31

主观题的评分受到很多因素的影响,如评分者的知识水平、综合能力和个人偏好等。这些评分者偏差不仅会导致不同评分者之间存在主观差异,也会到导致同一评分者在不同的时间也具有主观不稳定性,最终导致主观题评分信度的降低。本研究将多面Rasch模型运用到某国家级考试论述题的评分培训中。通过分析6名有经验评分者对58份试卷的试评数据,鉴别出四种评分者偏差,然后据此对每个评分者进行个别反馈,从而提高评分的客观性和精确性。相似文献

17.

计算机自适应测验中Rasch模型稳健性的模拟研究 总被引：1，自引：0，他引：1

邓远平蔡艳罗照盛《考试研究》2006,(3)

本研究采用模拟数据的方法,在计算机自适应测验(Computer Adaptive Test,简称CAT)中分别采用Rasch及Birnbaum两种模型估计能力,通过比较两者的误差均方根(Root Mean Square Error,简称RMSE)、平均差异(Average Deviation,简称AD)及能力相关,对Rasch模型在CAT中的稳健性进行了研究。结果发现Rasch模型在区分度不等的条件下仍然能较准确地估计被试的能力水平,具有很强的稳健性。相似文献

18.

基于Rasch模型评测学生线上学习的效果

罗福海《教育与装备研究》2021,37(9):68-71

2020年上半年受疫情影响,全国大中小学校普遍开展线上教学,其主要目的是巩固和提高学生对知识的掌握程度.文中基于学生线上学习期间2次生物测试成绩,利用Rasch模型评测学生线上学习的效果,发现线上学习后,学生能力有所提高. 相似文献

19.

基于Rasch模型分析测评工具质量的研究述评

《中国考试》2020,(2)

综合国内外相关文献分析,基于Rasch模型的研究可分为3个类型:对单个测评工具质量的研究、对多个测评工具的等值研究及计算机自适应测试研究。对单个测评工具质量的研究是基础,基于研究维度可分为单维度和多维度研究,基于研究层面可分为双层面和多层面研究。根据研究维度、层面以及测评计分方式,研究需采用不同类型的Rasch模型。除基础Rasch模型外,Rasch模型还包括多维度Rasch模型、多层面Rasch模型、分部评分模型、评定量表模型等。相似文献

20.

基于Rasch模型的中学生化学微粒观测评研究

黄泰荣王辉《化学教学》2022,(11):15-20

微粒观强调从宏微结合的视角认识身边物质世界的思维方法,体现了化学学科的思维特征。根据学习进阶理论,对微粒观进行了层级划分,基于Rasch模型开发和优化了测评工具,并且实施了测试及数据分析。研究显示测评工具具有较好的信度、效度。测试结果表明：高中三个年级学生的微粒观水平均达到“建立宏微关系”层次,其中高一和高二学生的微粒观水平并没有显著差异,而都与高三学生有显著差异;男生的微粒观水平高于女生。相似文献