共查询到20条相似文献,搜索用时 15 毫秒
1.
七十年代以来,项目反应理论(ItemResponse Theory,IRT)成了测量专家关心的主要课题之一。IRT中单参数Log-istic模型常称为Rasch模型,它是由丹麦数学家Georg Rasch沿着与其他项目反应模型非常不同的路线推导出来的本文旨在介绍Rasch模型在实际中的一些应用和一种模型参数的估计方法。这种方法可以借助于手算完成,从而使普通中学老师也可以作一些IRT的题目分析工作。一、模型及其应用IRT理论认为,潜在能力测量模型至少应该包括被测对象(考生)的行为反应与潜在能力的度量。前者是可观察的,后者是待估计的。Rasch模型可以表示为 相似文献
2.
本研究的目的是描述一个用于测量写作能力的多面Rasch(FACETS)模型。该FACETS模型是Rasch测量模型的多元变量拓展,它可为写作测评中的校标评分员和写作题目提供框架。本文展示了如何应用FACETS模型解决大型写作测评中遇到的测量问题。参加全州写作考试的1000个随机抽取的学生样本被用来显示该FACETS模型。数据表明即使经过强化训练,评分员的严格度有显著区别。同时,本研究还发现,写作题目难度的区分,虽然微小,却具有统计意义上的显著性。该FACETS模型为解决以作文测评写作能力的大型考试遇到的测量问题提供了一个有前景的途径。 相似文献
3.
Rasch模型是单参数Logistic模型,也是最简单的IRT模型,它与潜在类别模型相结合便形成了“混合Rasch模型”(MRM),目前已提出了二级计分模型、多级计分模型和多水平模型等表达式.MRM的参数估计研究通常涉及参数估计和模型评价两大基本过程,其中MCMC算法的应用最为常见.由于MRM在检测项目功能差异方面具有独特的优势,其原理简单明了,因而其研究和应用得到广泛认可.不过,MRM的提出与发展虽然弥补了传统IRT模型的相关缺陷,但其理论及其用于项目功能差异分析的研究空间还非常大.研究者有必要进一步加强MRM的理论研究及其用于项目功能差异分析的研究,在拓展其应用研究领域的同时,本土化研究问题也必须考虑进来. 相似文献
4.
由2007年开始,香港中学会考中国语文科及英国语文科采用了水平参照模式(standards-referenced reporting)对考生的成绩进行等级评定。在分数处理过程中,采用了含结构参数的Rasch模型。本文介绍了该模型及其一些主要性质,导出了联合极大似然估计(Joint Maximum Likelihood Estimation)的求解方程,并报告了应用该模型于香港中学会考水平参照等级评定中的主要结果。 相似文献
5.
Rasch模型具有被试参数和项目参数相互独立的性质,即被试能力与项目难度无关。本研究以某年度大学入学考试数学学科的实测成绩数据为例,在随机抽样、不同性别抽样、不同水平群体抽样等条件下,对Rasch模型项目参数不变性进行了验证研究。研究表明:Rasch模型项目参数不变性验证的前提条件较为严格,需要排除诸多干扰因素的影响;Rasch模型项目参数不变性的验证存在一定的误差,无法实现与理论一致的"不变性";Rasch模型项目参数不变性没有统一的标准,需依据实际问题确定。 相似文献
6.
在学科教学中,发展学生的学科能力是一项重要的目标,因此,有必要开发测试工具检测学生的学科能力。本研究结合心理学理论和语文学科特色,对语文学科能力进行了基于学习理解、实践应用和创造迁移三个能力层级的划分和描述,以北京市10所中学1679个样本进行测试,基于Rasch模型,着重探讨根据学生能力表现对测试工具进行检测与评估。 相似文献
7.
随着教育评价理论的发展和信息科技的进步,题库建设愈发强调试题存储、管理和调用的动态过程。在这一动态过程中,按照什么标准和程序检验、添加新试题是题库维护工作的重要议题。以某学科学业能力测评的题库维护为例,使用基于Rasch模型的链接测评技术和题库维护方案,选择链接设计后重组题库,通过分析新、旧题库的试题所考查的能力维度、难度指标、功能差异等评估链接质量,将检验合格的18道试题存入题库。基于Rasch模型的题库维护方案提供了一套较为系统的工作程序和检验指标。 相似文献
8.
9.
10.
课程标准是教师教学实施和考试评价的依据。研发测评试题在素养进阶的过程中有重要的意义。该研究的目的是采用项目反应理论研制初中生化学素养的测评试题,为加强素养进阶的实证研究、应用研究提供参考。研究过程为:基于义务教育化学课程标准(2022年版)质量要求研制中期调研试题测评试题,研究问题、通过500个被试样本从项目一致性、单维度、项目-被试对应分析、拟合程度等多维度数据分析、拟合性较差试题项目分析,得出结果表明:在新课标颁布初期,初中生化学素养进阶与学业质量符合预期,通过表现性诊断报告为了解学生个性化发展、改进教学提供科学工具。 相似文献
11.
12.
王生军 《安徽广播电视大学学报》2004,(3):120-123
应用Rasch模型计算出来的题目难度值与被试样本无关,是题目的一项最重要的量化指标.Rasch模型的题目难度的计算在EXCEL程序中能很方便地完成,本文介绍了详细的计算步骤,并讨论了怎样用题目难度值来估算考生的能力水平. 相似文献
13.
15.
针对影响演讲比赛打分结果的各种误差来源,本文引入多面Rasch模型对评分进行分析。此模型在分析评分结果中的应用不但有利于有效测量考生的能力水平,而且为识别问题评委、完善评分规则、及评委培训等问题都提供了全新的解决思路。本文同时也介绍了多面Rasch模型的理论及其在演讲比赛评分中的应用框架。 相似文献
16.
多面Rasch模型在主观题评分培训中的应用 总被引:7,自引:2,他引:7
主观题的评分受到很多因素的影响,如评分者的知识水平、综合能力和个人偏好等。这些评分者偏差不仅会导致不同评分者之间存在主观差异,也会到导致同一评分者在不同的时间也具有主观不稳定性,最终导致主观题评分信度的降低。本研究将多面Rasch模型运用到某国家级考试论述题的评分培训中。通过分析6名有经验评分者对58份试卷的试评数据,鉴别出四种评分者偏差,然后据此对每个评分者进行个别反馈,从而提高评分的客观性和精确性。 相似文献
17.
计算机自适应测验中Rasch模型稳健性的模拟研究 总被引:1,自引:0,他引:1
本研究采用模拟数据的方法,在计算机自适应测验(Computer Adaptive Test,简称CAT)中分别采用Rasch及Birnbaum两种模型估计能力,通过比较两者的误差均方根(Root Mean Square Error,简称RMSE)、平均差异(Average Deviation,简称AD)及能力相关,对Rasch模型在CAT中的稳健性进行了研究。结果发现Rasch模型在区分度不等的条件下仍然能较准确地估计被试的能力水平,具有很强的稳健性。 相似文献
18.
2020年上半年受疫情影响,全国大中小学校普遍开展线上教学,其主要目的 是巩固和提高学生对知识的掌握程度.文中基于学生线上学习期间2次生物测试成绩,利用Rasch模型评测学生线上学习的效果,发现线上学习后,学生能力有所提高. 相似文献
19.
20.
微粒观强调从宏微结合的视角认识身边物质世界的思维方法,体现了化学学科的思维特征。根据学习进阶理论,对微粒观进行了层级划分,基于Rasch模型开发和优化了测评工具,并且实施了测试及数据分析。研究显示测评工具具有较好的信度、效度。测试结果表明:高中三个年级学生的微粒观水平均达到“建立宏微关系”层次,其中高一和高二学生的微粒观水平并没有显著差异,而都与高三学生有显著差异;男生的微粒观水平高于女生。 相似文献