首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
学生的数学素养具有多维结构,素养导向的数学学业成就测评需要提供被试在各维度上的表现信息,而不仅是一个单一的总分。以PISA数学素养结构为理论模型,以多维项目反应理论(MIRT)为测量模型,利用R语言的MIRT程序包处理和分析某地区8年级数学素养测评题目数据,研究数学素养的多维测量方法。结果表明:MIRT兼具单维项目反应理论和因子分析的优点,利用其可对测试的结构效度和测试题目质量进行分析,以及对被试进行多维能力认知诊断。  相似文献   

2.
大规模教育考试的维度与考试分数的意义解释、考生在考试中的行为表现解释密切相关。利用非参数项目反应理论模型选择试题组成单维量表,可以达到研究考试维度的目的。选择单维量表试题时,下界c值的确定,是个值得探讨的问题。用非参数项目反应理论模型对英语考试的三个量表维度研究发现,从每一个量表中只能选择出一个单维量表,而不是与每一部分测量的微技能数相应的多个单维量表;每一单维量表测量的均为该部分不同微技能的组合。这个特征表明这些单维量表均为基本单维量表,非严格单维量表。无论c值为0.3,还是0.2,选择出的基本单维量表均满足弱单调性要求,整个单维量表的区分功能不会有明显差异。  相似文献   

3.
为获得一个能科学测量学生数学学习归因能力,并且能够准确筛选不恰当归因能力水平个体的测量工具,研究应用项目反应理论方法对经典测量理论框架下相对成熟的“多维度—多归因因果量表”进行心理测量学评估.研究表明,原量表的心理测量学性质并不理想,但经过项目反应理论方法修正后的量表具有良好的心理测量学性质.量表具有积极归因和消极归因两因素维度结构,所含项目有良好的区分度和难度,且量表及其各项目(除N10)都能准确测量不恰当归因能力水平.  相似文献   

4.
项目反应数据的建模过程属于项目反应理论范畴,被称为现代测量理论。随着社会测量要求的广度和复杂度的增加,以及测量功能的不断扩展的要求,需要越来越复杂的项目反应模型来完成心理学、教育学、社会学等领域的测量任务。本文就当前较普遍以及发展迅速的项目反应复杂模型,如高阶、多维、多层模型进行论述,并且描述了复杂模型的参数评估技术,结合复杂模型的应用情况,期望本土的测量技术向客观化、尖端化发展。  相似文献   

5.
加强标准化题库建设是检测教学效果的必然要求,也是大学物理课程建设和教学改革的需要。运用项目反应理论开发题库,可以弥补基于经典测试理论的题库的不足,提高测量精度,缩短测验长度,使试题系数更加规范,保证试题的科学性和有效性。  相似文献   

6.
本文首先对项目反应理论的概念进行阐述,然后分析项目反应理论所具有的优点,最后再罗列出项目反应理论目前在网络教学中的应用,供读者参考。  相似文献   

7.
项目反应理论(Item Response Theory,IRT)又称题目反应理论、潜在特质理论,是在反对和克服经典测验理论(CTT)的不足之中发展起来的一种现代测量理论。  相似文献   

8.
非参数项目反应理论模型包括单调均匀性模型和双单调模型。用单调均匀性模型对某英语听力考试结果研究发现,按照顺序选择法,可从16道听力试题中选出11道满足要求的试题,组成单维量表。用考生在这11道试题上的总得分对考生进行排序与按照潜质排序等效。利用双单调模型对11道听力试题组成的单维量表进行试题功能偏差研究发现,有5道试题在女生子群体中的排序与在男生子群体以及整个群体排序不同,显示女生子群体作出正确应答的概率明显高于男生子群体作出正确应答的概率。这种差异至少部分是由两个子群体听力能力上的差异引起的。  相似文献   

9.
传统的项目反应理论模型由于不能很好地处理非连续数据而影响了对具有潜在类别属性的特质进行精确估计。混合项目反应理论不仅能够精确地估计项目参数和能力参数,而且可以实现按照不同类别属性的潜在特质与行为对被试进行自动鉴别。随着研究的发展,混合分部评分模型、混合Logistic模型、多水平项目反应理论模型以及带协变量的混合项目反应理论模型等相继诞生,并在教育测验分析与编制、项目功能差异分析以及其他拓展性实践应用中展现出优良的品质。开发多维混合项目反应理论模型、多维混合认知诊断模型以及混合题组模型等并对其进行本土化研究与应用将是混合项目反应理论的一大研究热点与方向。  相似文献   

10.
介绍了在网络考试系统中,经典测试理论(CCT)和项目反应理论(IRT)的优缺点,项目反应理论(IRT)理论模型及其应用,可以实现网络考试系统在组合试卷题目时,全面解决考试等值问题及参数估计更为准确等问题,使得考试系统能更科学地挑选试题。  相似文献   

11.
基于项目反应理论(IRT),采用离差加权值最小和测验项目信息函数值最高两个目标规划相结合的办法,设计了一个新的自动组卷数学模型。该模型克服了经典测量理论(CTT)的种种局限,有效解决了计量指标——信息量与非计量指标——题型分布、知识点分布等约束条件计算量纲不同的问题,很好地体现了测试项目信息函数值最高的组卷目标。  相似文献   

12.
经典测量理论与项目反应理论的比较研究   总被引:3,自引:1,他引:3  
文章通过对经典测量理论和项目反应理论的模型及其假设、主要概念和参数、测量水平等方面进行比较,廓清了两种理论的联系和区别,明确了两种理论的优势和不足,从而为研究者根据测验实践的要求和各个理论的适用条件选择恰当的分析框架提供思路。  相似文献   

13.
张军 《考试研究》2014,(1):56-61
单调匀质模型是非参数项目反应理论中使用最广泛的模型,它有三个基本假设,适用于小规模测验的分析。本研究使用MHM分析北京语言大学汉语进修学院某次测验,结果表明测验满足弱单维性假设与弱局部独立性假设,67个项目中有9个项目的量表适宜性系数低于0.3,需要修改或删除,删除后测验为中等强度的Mokken量表。另外,有2个项目违反了单调性假设,不符合Mokken量表的要求。  相似文献   

14.
RCMLM模型是基于Rasch测量理论的通用拓展模型。利用RCMLM模型对一份普通高中数学试卷进行不同性别的DIF分析。结果表明:该模型可对具有二分计分和多分计分的试题同时进行DIF分析,避免了以往分别对两种计分方式试题进行DIF分析的弊端,保持了试卷的完整性,使DIF分析结果更加有效。  相似文献   

15.
Rasch模型和IRT在学生成就测验统计分析中的对比研究   总被引:1,自引:0,他引:1  
Rasch模型和项目反应理论的诞生推进了社会科学领域研究方法的变革。大多数学者认为,Rasch模型就是三参数IRT模型的特例。其实,Rasch模型不同于项目反应理论,其数据必须符合模型的先验理论。研究利用基于这两种理论假设开发的软件Winsteps和Multilog对学生成就测验进行统计分析,旨在揭示两种理论模型数据分析结果的异同之处,并探讨Winsteps软件在教育统计中的应用。  相似文献   

16.
应用项目反应理论等值含有多种题型考试的一个实例   总被引:2,自引:2,他引:2  
本文以美国一个州的高中统考为例介绍应用项目反应理论来对含有多种题型的考试进行等值处理的具体做法,同时也对考试的其他技术环节进行了一些探讨。  相似文献   

17.
项目反应理论下的测验信度能够评价潜在特质估计的可靠性与稳定性,由于具有宏观性的特点,项目反应理论信度的作用并不能被测验信息函数所取代,是IRT测验的一个重要指标。本文参考国内外文献,首先介绍国内外学者关于IRT信度作用的观点,并介绍和评价了多种IRT信度估计方法,然后简要介绍IRT信度的影响因素,最后展望了IRT信度领域后续研究尚可着力之处。  相似文献   

18.
崔维真 《考试研究》2012,(6):88-93,50
本研究根据前人的研究成果,选用单维等级反应模型(GRM),对高等汉语水平考试(简称HSK[高等])口试进行了实验分析。实验假设,等级反应模型下的评分能够更加精细地区分被试的能力。最终实验结果证实了该假设。  相似文献   

19.
以概化理论和项目反应理论为代表的现代测验理论是在克服经典测验理论缺陷的基础上产生的。概化理论是在经典测验理论的基础上,引入实验设计和方差分析技术,对测评情境中的各类误差进行分解和控制的一种现代测量理论,其发展主要经历了一元概化理论和多元概化理论两个阶段。目前,其应用主要集中在评价、考试和评定量表编制三个领域。项目反应理论是在克服经典测验理论题目参数等指标的变异性基础上发展起来的一种现代测验理论,其发展经历了早期理论探索、理论初步形成和理论逐渐完善三个阶段。它主要用于处理分数等值和测验项目参数、测验和项目的质量的分析,剥离测验情境中评委特征对测验结果的影响,以及测查项目功能差异、编制适应性测验等。  相似文献   

20.
高考是我国现阶段最有影响的高厉害大规模教育考试。因此,研究高考质量具有重大的意义。在过去十年中,我国学者对高考的信度和效度的研究多局限于运用古典考试理论。本文提出了运用项目反应理论进一步研究我国高考的信、效度的建议,并探讨了运用等值、链接等当代教育测量学技术,建立跨地区、跨年分的高考大型数据库的可能。这些方面的研究可以为高考改革及相关教育决策提供更多可靠信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号