首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本研究利用多面rasch模型(MFRM)评估大学生"多元统计方法分析"课程的能力水平,并分析题目的难度和评分者的严苛度。研究结果显示,多面Rasch分析可以很好地解决开放式考试中对于学科能力的评估,其评估结果与学生的反馈一致。  相似文献   

2.
本研究以概化理论和多面Rasch模型为工具,对某市教育教学能力测试的一批实测结果进行了分析,旨在探索影响此类测试评分的因素及其作用机制,为完善测试设计和评分培训提供依据。研究结果表明,影响教育教学能力测试的主要因素是任务难度、评委宽严、评委的跨任务一致性和任务的跨考生难度。当前的教育教学能力测试只适宜做相对决策,不适宜做绝对决策。建议在以后的测试中通过提高测试任务的数量和加强对评分员的针对性培训来提高评分可靠性。  相似文献   

3.
采用多面Rasch模型,以913名高中生为研究对象,从被试、评分员、任务和评分标准四个层面对外语写作思辨能力评价进行效度验证.研究结果显示:(1)包含提出问题、表达观点、提供证据、推理论证、得出结论、阐释评价的评价框架符合多面Rasch模型的测评要求,能体现并合理区分被试的外语写作思辨能力.(2)推理论证和提供证据对测...  相似文献   

4.
针对影响演讲比赛打分结果的各种误差来源,本文引入多面Rasch模型对评分进行分析。此模型在分析评分结果中的应用不但有利于有效测量考生的能力水平,而且为识别问题评委、完善评分规则、及评委培训等问题都提供了全新的解决思路。本文同时也介绍了多面Rasch模型的理论及其在演讲比赛评分中的应用框架。  相似文献   

5.
多面Rasch模型在主观题评分培训中的应用   总被引:7,自引:2,他引:7  
主观题的评分受到很多因素的影响,如评分者的知识水平、综合能力和个人偏好等。这些评分者偏差不仅会导致不同评分者之间存在主观差异,也会到导致同一评分者在不同的时间也具有主观不稳定性,最终导致主观题评分信度的降低。本研究将多面Rasch模型运用到某国家级考试论述题的评分培训中。通过分析6名有经验评分者对58份试卷的试评数据,鉴别出四种评分者偏差,然后据此对每个评分者进行个别反馈,从而提高评分的客观性和精确性。  相似文献   

6.
多面Rasch模型(MFRM)是Rasch单参数模型的延伸,对于检测不同测量层面一致性差异具有很好的支持作用。本文聚焦于运用多面测量模型的分析软件FACETS,重点阐述如何利用TXT数据文件和Excel数据文件生成控制数据文件的方法步骤。力求通过详细的过程介绍并配合图文说明,使学习者对Facets控制数据文件生成有更加清晰的认识,为后续应用Rasch模型开展数据分析奠定基础。  相似文献   

7.
在学科教学中,发展学生的学科能力是一项重要的目标,因此,有必要开发测试工具检测学生的学科能力。本研究结合心理学理论和语文学科特色,对语文学科能力进行了基于学习理解、实践应用和创造迁移三个能力层级的划分和描述,以北京市10所中学1679个样本进行测试,基于Rasch模型,着重探讨根据学生能力表现对测试工具进行检测与评估。  相似文献   

8.
评分标准是测试构念的可操作化体现。本文介绍了EBB评分标准的定义和优势,尝试了如何基于考生真实的测试表现数据,为一项低风险的大规模初中英语口语测试制定EBB评分标准,并基于项目反应理论,利用多面Rasch模型对其进行效度验证。研究结果表明,包含语音语调、准确性、交际有效性和任务完成度四个评分维度的EBB评分标准符合分割指数、平均测量值和未加权均方拟合指数等关键测量指标要求,具有较好的效度,并且分数段划分合理,可操作性强。  相似文献   

9.
目前电大系统英语考试的口试和作文部分多采用语言运用测试的方式.语言运用测试由于引入评分者而使评分的主观性变大.如何控制评分者差异对考生分数的影响成为保证语言运用测试评分质量的重要环节.本文在比较了行为测试中评分质量控制方面常用的三种理论的基础上,着重介绍了多面Rasch模型在提高评分质量方面的贡献,并探讨了在电大系统如何采用该模型对英语运用测试中的评分者进行培训,以控制评分质量和提高考试信度.  相似文献   

10.
11.
主观性测试中,评分员差异是影响测试信度、效度和公平性的重要因素。本文采用多面Rasch模型考察8位评分员对记叙文和议论文两种体裁各60篇作文的评分情况。结果表明,评分员对不同体裁作文的评分存在不一致性:在评分员层面上,评分员的严厉度基本不受体裁的影响,但在评分员的信度与内在一致性方面,议论文评分好于记叙文评分;在评分量表层面上,评分员在评定语言和内容项目上,议论文比记叙文严格,而在条理项目上,议论文比记叙文宽松,并且议论文高分的使用频率比记叙文高。本文还就评分员评分的不一致性的原因进行了探讨,以求为降低评分偏差提供参考。  相似文献   

12.
13.
以能力考察为核心的语文测试评价框架包括学习理解、实践应用和创新迁移三个能力层级。在建构中学生语文学科能力构成体系的基础上,对北京市两个区的七年级至十一年级共4322名中学生的语文能力进行测试,运用Rasch模型进行分析与讨论,研究结果发现:从学习理解能力来说,中学生尤其应该加强分析概括能力和领会理解能力的培养;从实践应用能力来说,语文教学应该关注中学生应用交际能力的培养。针对不同的文类,应该培养学生的文类意识;从创新迁移能力来说,应该重视培养中学生的写作能力,尤其在内容创新、表达真情实感等方面更需要加强。  相似文献   

14.
15.
本研究以PETS-1级拟聘口试教师为研究对象,对口试教师评分的培训效果进行了研究。采用多面Rasch分析对比口试教师接受培训前后的评分效果。结果发现:培训后,提升了口试教师与专家评分完全一致的比率,评分偏于严格的口试教师在评分标准上做了恰当的调整,所有口试教师评分拟合值都在可接受范围内,总体上,口试教师评分的培训比较有效,培训后提升了评分的准确性。多面Rasch分析有助于发现评分过于宽松、过于严格、评分拟合差的口试教师以及评分异常情况,为开展有针对性地培训提供了可靠的依据。  相似文献   

16.
随着教育评价理论的发展和信息科技的进步,题库建设愈发强调试题存储、管理和调用的动态过程。在这一动态过程中,按照什么标准和程序检验、添加新试题是题库维护工作的重要议题。以某学科学业能力测评的题库维护为例,使用基于Rasch模型的链接测评技术和题库维护方案,选择链接设计后重组题库,通过分析新、旧题库的试题所考查的能力维度、难度指标、功能差异等评估链接质量,将检验合格的18道试题存入题库。基于Rasch模型的题库维护方案提供了一套较为系统的工作程序和检验指标。  相似文献   

17.
《考试周刊》2015,(73):161-162
本文将科学测量理论的多面Ranch模型理论用于师范生说课技能评价的数据分析,为相关评价提供信效度信息,同时为未来教育测评提供有价值的参考。  相似文献   

18.
19.
在教育与心理测量中,Rasch测量模型具有客观和等距量尺的特性。本文利用怀特图对某学校一份数学考试成绩进行了多面Rasch分析。结果表明,相比于经典测量理论,基于Rasch测量模型的试题分析评价更加客观。  相似文献   

20.
课程标准是教师教学实施和考试评价的依据。研发测评试题在素养进阶的过程中有重要的意义。该研究的目的是采用项目反应理论研制初中生化学素养的测评试题,为加强素养进阶的实证研究、应用研究提供参考。研究过程为:基于义务教育化学课程标准(2022年版)质量要求研制中期调研试题测评试题,研究问题、通过500个被试样本从项目一致性、单维度、项目-被试对应分析、拟合程度等多维度数据分析、拟合性较差试题项目分析,得出结果表明:在新课标颁布初期,初中生化学素养进阶与学业质量符合预期,通过表现性诊断报告为了解学生个性化发展、改进教学提供科学工具。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号