首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 9 毫秒
1.
应用Rasch模型计算出来的题目难度值与被试样本无关,是题目的一项最重要的量化指标.Rasch模型的题目难度的计算在EXCEL程序中能很方便地完成,本文介绍了详细的计算步骤,并讨论了怎样用题目难度值来估算考生的能力水平.  相似文献   

2.
3.
Rasch模型和IRT在学生成就测验统计分析中的对比研究   总被引:1,自引:0,他引:1  
Rasch模型和项目反应理论的诞生推进了社会科学领域研究方法的变革。大多数学者认为,Rasch模型就是三参数IRT模型的特例。其实,Rasch模型不同于项目反应理论,其数据必须符合模型的先验理论。研究利用基于这两种理论假设开发的软件Winsteps和Multilog对学生成就测验进行统计分析,旨在揭示两种理论模型数据分析结果的异同之处,并探讨Winsteps软件在教育统计中的应用。  相似文献   

4.
本研究以概化理论和多面Rasch模型为工具,对某市教育教学能力测试的一批实测结果进行了分析,旨在探索影响此类测试评分的因素及其作用机制,为完善测试设计和评分培训提供依据。研究结果表明,影响教育教学能力测试的主要因素是任务难度、评委宽严、评委的跨任务一致性和任务的跨考生难度。当前的教育教学能力测试只适宜做相对决策,不适宜做绝对决策。建议在以后的测试中通过提高测试任务的数量和加强对评分员的针对性培训来提高评分可靠性。  相似文献   

5.
2020年上半年受疫情影响,全国大中小学校普遍开展线上教学,其主要目的 是巩固和提高学生对知识的掌握程度.文中基于学生线上学习期间2次生物测试成绩,利用Rasch模型评测学生线上学习的效果,发现线上学习后,学生能力有所提高.  相似文献   

6.
计算机自适应测验中Rasch模型稳健性的模拟研究   总被引:1,自引:0,他引:1  
本研究采用模拟数据的方法,在计算机自适应测验(Computer Adaptive Test,简称CAT)中分别采用Rasch及Birnbaum两种模型估计能力,通过比较两者的误差均方根(Root Mean Square Error,简称RMSE)、平均差异(Average Deviation,简称AD)及能力相关,对Rasch模型在CAT中的稳健性进行了研究。结果发现Rasch模型在区分度不等的条件下仍然能较准确地估计被试的能力水平,具有很强的稳健性。  相似文献   

7.
如何对学习者进行精准化、个性化的诊断和评价是智慧教育时代的重要议题。目前学习诊断的主流方式依然是通过考试成绩对学生知识掌握程度进行评价,容易忽略对学生认知能力的评价,不符合智慧教育既重视知识传授也重视能力培育的价值取向。本研究基于Rasch模型,以政治学科为例,组建月考试卷,并编制双向细目表为试题标记知识点属性和认知能力属性,进而探索一种基于考试成绩挖掘学生认知能力的方法。本研究收集了195名学生的作答数据,使用Rasch模型,分析成绩背后每位学生的知识掌握情况,并判断学生对各认知能力层次的达成情况,同时根据分析结果生成雷达图进行可视化输出,实现学生认知分析在混合式课堂中的常态化使用。本研究试图为智慧教育时代学习的精准诊断提供一种新思路。  相似文献   

8.
采用多面Rasch模型,以913名高中生为研究对象,从被试、评分员、任务和评分标准四个层面对外语写作思辨能力评价进行效度验证.研究结果显示:(1)包含提出问题、表达观点、提供证据、推理论证、得出结论、阐释评价的评价框架符合多面Rasch模型的测评要求,能体现并合理区分被试的外语写作思辨能力.(2)推理论证和提供证据对测...  相似文献   

9.
大学教师课堂教学能力评价是提高教学质量的重要手段。基于多面Rasch模型,实证结果表明不同听课人之间打分的宽严度不一致并对三个评分维度把握不准确,使用教师能力估计值结合聚类分析法划分等级才能更加准确地对大学教师的课堂教学能力进行评价。该方法的实施需要数据分析常态化、听课人管理制度化和评价项目动态更新的管理措施共同推进。  相似文献   

10.
一个关于能力与教育水平的简单模型   总被引:2,自引:0,他引:2  
从 1 999年起 ,在近几年内与我国高等教育扩招相适应的研究生招生保持了 3 0 %左右的增长率持续扩招 ,报考人数也因此大幅度增加。但是 ,研究生、博士生这种高层次教育 ,并不是对每个人都是合适的。本文主要从经济学净收益角度对不同能力者进行了比较分析。首先 ,人才质量Q主要由教育水平E和能力A决定。我们假定 :Q =AαEβ  (α+β<1 )不同的工作岗位 ,对雇员的要求可能体现出能力和教育水平上的不同权重 ,即α和 β的实际取值可能会有所差别 ,比方说 ,对技术性要求很强的工种 ,如机床操作 ,α的取值会相对大一些 ,而对知识性要求很…  相似文献   

11.
以能力考察为核心的语文测试评价框架包括学习理解、实践应用和创新迁移三个能力层级。在建构中学生语文学科能力构成体系的基础上,对北京市两个区的七年级至十一年级共4322名中学生的语文能力进行测试,运用Rasch模型进行分析与讨论,研究结果发现:从学习理解能力来说,中学生尤其应该加强分析概括能力和领会理解能力的培养;从实践应用能力来说,语文教学应该关注中学生应用交际能力的培养。针对不同的文类,应该培养学生的文类意识;从创新迁移能力来说,应该重视培养中学生的写作能力,尤其在内容创新、表达真情实感等方面更需要加强。  相似文献   

12.
教育测验是进行教育测量的最主要手段,测验结果直接反映着教学质量和学校教育活动结果,因此,对它的解释和分析尤为重要。实践证明,教育测验本身内含良好的评价功能,充分发挥这一功能的作用,不仅利于完善考试制度,而且对端正办学思想,强化教学管理、大面积提高教学质量具有十分重要的作用。只有形成教学→测验→评价→教学的正向良性循环,才能更好地发挥测验的评价和导向功能及在教学全过程中应有的作用。特别是测验结果中错误答案的分析所提供的反馈信息,对实施再教学及良性教育循环系统的形成具有重要的现实意义与指导意义。  相似文献   

13.
Rasch模型应用在试卷质量分析中有如下方法:怀特图(Wright Map)——让读者对试卷的整体情况有一个大致地了解;多维性检验(Multidimensionality Investigations)——考查试卷是否测量被试的同一潜在特质(即阅读能力);项目拟合和误差统计(ITEM:fit order)、气泡图(Bubble Diagram),等等。文章以广西壮族自治区五六年级学生阅读素养前测试卷的质量分析为例,呈现了Rasch模型测评的过程。测评表明,该试题总体上是一套高质量的试卷,试题项目覆盖了所有能力水平的被试,难度编制合理,绝大多数题目达到了预期的测验效果。然而,由于测量目标的不同,Rasch模型功能和指标的选择以及结果的解释都存在相当大的差异,研究者需要基于测量目标进行选择,根据实际情况灵活处理。  相似文献   

14.
多面Rasch模型(MFRM)是Rasch单参数模型的延伸,对于检测不同测量层面一致性差异具有很好的支持作用。本文聚焦于运用多面测量模型的分析软件FACETS,重点阐述如何利用TXT数据文件和Excel数据文件生成控制数据文件的方法步骤。力求通过详细的过程介绍并配合图文说明,使学习者对Facets控制数据文件生成有更加清晰的认识,为后续应用Rasch模型开展数据分析奠定基础。  相似文献   

15.
在研究中,我们发现,罗马尼亚中小学生的数学成绩相较于中国同龄的孩子,不能够让人满意,原因也许是多方面的,此研究从两国的教学中最为客观的材料——学生课本入手,进行难度的比较,试图发现隐藏在背后的真相。  相似文献   

16.
教育评价是教育活动的重要组成部分,它是以教育目标为依据,运用有效的评价技术和手段,对教育活动的过程和结果进行测定、分析、比较,并给以价值判断的过程。而学生的学科学业水平的评价是教育评价的基础性工程之一,本文拟结合多年来的探索实践谈谈笔者的体会。  相似文献   

17.
2007年5月对长江大学外国语学院英语专业2004级120名本科生汉语水平的现状进行调查,结果显示:汉语水平在英汉互译中作用重大,大部分学生对自己目前的汉语水平感到不满,认为自己的汉语水平亟待提高。  相似文献   

18.
19.
本研究运用空间旋转测验与皮亚杰的水平测验考查了大学生的空间能力与其所学专业的关系。被试为北京地区的 2 97名本科生 ,来自美术、数学、中文等 5个专业。结果表明 ,理科系与美术系学生的空间能力高于文科系 (P <0 0 1 ) ;在各专业中 ,男生的空间能力高于女生 (P <0 0 1 ) ;在解决水平问题方面 ,这种专业与性别的差异可以通过教育训练而改变。  相似文献   

20.
课程难度模型在运用中出现的偏差有:(1)用"知识点"的多少来量化课程广度;(2)用最大抽象度来刻画课程深度;(3)用目标动词赋值的平均数来表示课程深度.与此相对应,要做如下修正:(1)用所有课程目标的多少来量化课程广度;(2)用抽象度的总和来刻画课程深度;(3)用课程目标赋值的总和来表示课程深度.运用修正后的方法计算可知:<课程标准>的课程知识难度最低.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号