首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
基于项目反应理论,以高中化学平衡测验的编制为例,探索了化学测验的编制方法。首先,基于高中化学课程标准、考试大纲、高考试题等文本材料,构建了化学平衡内容的属性模型;其次,编制了3份化学平衡的预测卷,利用项目反应理论软件——BILOG-MG3.0,估算每个项目的难度、区分度、信息量等参数和被试的能力值(θ);最后,基于信息函数的测验编制法,组建了一份效度较好、信度较高的测验卷。  相似文献   

2.
《天津工程师范学院学报》2007,17(2):F0002-F0002
(项目号60671009)国家自然科学基金资助项目《毫米波介质谐振器天线的理论及技术研究》的主要内容为:(1)发展有限接地平面介质谐振器天线的高效数值分析方法——几何绕射理论和矩量法的混合方法,以及并行的隐式时域有限差分方法,对研究对象进行数值分析。  相似文献   

3.
测验项目编制与等值的一种有效策略——层面理论   总被引:2,自引:0,他引:2  
回转翻译法关注的是“文字等价”,项目反应理论注重“统计指标等价”。层面理论项目等价注重项目的同一测量目标,即等值的项目应该在相同的条件下测试被试相同的反应。层面理论通过映射语句技术清晰地界定项目的测量目标,使得项目等值与项目编制更加科学。通过层面理论编制的项目维度结构更加清楚,测验的结构效度更有保证。将层面理论和心理计量学的其他方法结合起来,可以有效提高测验项目编制与等值的质量。  相似文献   

4.
运用项目反应理论对2015年12月CET4多题多卷(一)阅读理解试题质量进行分析。结果显示:阅读理解类试题具有单维性;该部分题目属于中上难度水平,区分度理想,猜测系数低,用于测试中上水平考生时准确性最高;相当一部分仔细阅读多项选择题的信息量没有达标,这部分题目的质量值得进一步研究与改进。  相似文献   

5.
本文介绍了心理测量理论与技术在美国医师执照考试中的应用情况,包括考生构成和及格率的简要描述;项目反应理论的基本要点及其在医师执照考试统计分析,题库建设、考试设计和组卷程序中的具体应用;测验分数等值化的方法,分数报告形式以及及格标准的制定程序。  相似文献   

6.
通过对经典测量理论与项目反应理论在基本假设、测验精度计量、测验的标准误以及测验项目的筛选等四个主要领域的比较,可以发现项目反应理论具有被试能力估计的项目选择独立性、项目难度参数与能力参数的刻度统一性、项目参数估计的样本独立性、估计测量误差的精确性等几个优点;但是在某些模型中存在单维性假设难以满足、测验条件要求严格以及数学模型简约性差等需要解决的问题。  相似文献   

7.
介绍了项目反应理论和组卷算法实现的基本步骤,并以此为基础设计了个基于Web的在线考试系统,介绍了采用ASP技术的实现方案和几个关键技术问题的解决。  相似文献   

8.
基于项目反应理论的测验编制方法研究   总被引:3,自引:0,他引:3  
本文在简单介绍项目反应理论的基础上,从计量分析的角度,深入探讨了应用项目反应理论编制各种测验的一般步骤;探讨了项目反应理论题库建设方法及基于题库的测验编制方法;探讨了标准参照测验合格分数线的划分方法。  相似文献   

9.
目的:与经典测量理论相比,项目反应理论具有更多的优势,但由于项目反应理论模型的复杂性,进行参数估计时往往需要较大的被试样本;人工神经网络的出现为小样本被试估计项目反应理论的能力参数和项目参数提供了可能,文章的目的是通过神经网络的蒙特卡罗模拟研究寻找更精确的参数估计方法。方法:以项目反应理论的两参数模型为例,以MAB和RMSE为比较指标,通过模拟数据比较经典测量理论的通过率、点二列相关系数、平均得分作为神经网络的输入值与以经过转换的数值(IRT参数估计的初值)作为神经网络的输入值训练网络结果的差异,比较不同条件下MAB指标和RMSE指标的差异。结果:以通过率估计项目参数b与以 bj=zj/rbj估计项目参数b存在差异;以点二列相关系数估计项目参数a与以 aj=rbj/ 1-r2bj(1/2)估计项目参数a存在差异;以平均得分估计能力参数θ与以 ln[ x/(m-x)]估计能力参数θ存在差异。结论:对于两参数项目反应模型,以通过率估计项目参数b比以 bj=zj/rbj估计项目参数b误差更小,而以点二列相关系数估计项目参数 a 比以 aj=rbj/ 1-r2bj(1/2)估计项目参数a存在差异;以平均得分估计能力参数θ与以 ln[ x/(m-x)]估计能力参数θ存在差异。结论:对于两参数项目反应模型,以通过率估计项目参数b比以 bj=zj/rbj估计项目参数b误差更小,而以点二列相关系数估计项目参数 a 比以 aj=rbj/ 1-r2bj(1/2)估计项目参数 a 误差更大,以平均得分估计能力参数θ比以ln[ x/(m-x)]估计能力参数θ误差更大。  相似文献   

10.
本文旨在基于项目反应理论(IRT),以高中三角函数为例,编制了一份诊断性测试卷.首先根据课标、考试大纲等文本材料确定三角函数考试要点,从历年高考试题中选取了15个项目,对40名学生进行预测试,发现项目1的难度参数为-8.99,不在(-3,3)内,且其项目信息函数曲线出现异常,予与删除,同时也说明项目反应理论克服了经典测量理论的缺点,在诊断性测试卷的编制上具有突出优势.  相似文献   

11.
项目反应理论下的测验信度能够评价潜在特质估计的可靠性与稳定性,由于具有宏观性的特点,项目反应理论信度的作用并不能被测验信息函数所取代,是IRT测验的一个重要指标。本文参考国内外文献,首先介绍国内外学者关于IRT信度作用的观点,并介绍和评价了多种IRT信度估计方法,然后简要介绍IRT信度的影响因素,最后展望了IRT信度领域后续研究尚可着力之处。  相似文献   

12.
回顾国内外有关小样本情况下估计试题的Logistic IRT参数的研究,可以总结出六种参数估计方法,分别是:修改IRT模型法、提供先验信息法、人工神经网络法、非参数估计法、经典测验理论标准化法以及使用数据增强技术。后续研究应加强对已有参数估计方法的改进,使用包括标准误在内的多种误差指标,在250人以内的样本水平上,采用模拟数据与真实数据相结合的模拟实验法开展更加严谨的模拟研究。  相似文献   

13.
以概化理论和项目反应理论为代表的现代测验理论是在克服经典测验理论缺陷的基础上产生的。概化理论是在经典测验理论的基础上,引入实验设计和方差分析技术,对测评情境中的各类误差进行分解和控制的一种现代测量理论,其发展主要经历了一元概化理论和多元概化理论两个阶段。目前,其应用主要集中在评价、考试和评定量表编制三个领域。项目反应理论是在克服经典测验理论题目参数等指标的变异性基础上发展起来的一种现代测验理论,其发展经历了早期理论探索、理论初步形成和理论逐渐完善三个阶段。它主要用于处理分数等值和测验项目参数、测验和项目的质量的分析,剥离测验情境中评委特征对测验结果的影响,以及测查项目功能差异、编制适应性测验等。  相似文献   

14.
经典测量理论与项目反应理论的比较研究   总被引:3,自引:1,他引:3  
文章通过对经典测量理论和项目反应理论的模型及其假设、主要概念和参数、测量水平等方面进行比较,廓清了两种理论的联系和区别,明确了两种理论的优势和不足,从而为研究者根据测验实践的要求和各个理论的适用条件选择恰当的分析框架提供思路。  相似文献   

15.
张军 《考试研究》2014,(1):56-61
单调匀质模型是非参数项目反应理论中使用最广泛的模型,它有三个基本假设,适用于小规模测验的分析。本研究使用MHM分析北京语言大学汉语进修学院某次测验,结果表明测验满足弱单维性假设与弱局部独立性假设,67个项目中有9个项目的量表适宜性系数低于0.3,需要修改或删除,删除后测验为中等强度的Mokken量表。另外,有2个项目违反了单调性假设,不符合Mokken量表的要求。  相似文献   

16.
在美国,各个考试公司都会用不同的统计方法来检测考试中的舞弊现象。本文研究了两个检测舞弊的指数:基于经典考试理论的g2指数和基于项目反应理论的w指数。文章模拟了四种真实测试情形中常见的抄袭模式和几个可能影响指数的变量,研究结果表明,对于g2和w指数,在各种情形下,按照有偏差的估计参数以及真实参数计算出来的第一类错误率都是类似的,并且较低。因此,用有偏差的估计参数来计算g2和w指数不会增加将被抄袭者误认为抄袭者的可能性。而基于有偏差的估计参数的g2和w指数,只有在抄袭题目百分比较高且测试长度较长的情况下,才可能实现较低的第二类错误率。当抄袭题目百分比较低时,即便使用真实参数,g2和w指数都会造成较高的第二类错误率。  相似文献   

17.
本文通过标准参照测验的研究,以编制标准参照测验的理论为依据,以项目反应理论指导,结合操作系统的考试科目给出了标准参照测验的编制过程。  相似文献   

18.
In test development, item response theory (IRT) is a method to determine the amount of information that each item (i.e., item information function) and combination of items (i.e., test information function) provide in the estimation of an examinee's ability. Studies investigating the effects of item parameter estimation errors over a range of ability have demonstrated an overestimation of information when the most discriminating items are selected (i.e., item selection based on maximum information). In the present study, the authors examined the influence of item parameter estimation errors across 3 item selection methods—maximum no target, maximum target, and theta maximum—using the 2- and 3-parameter logistic IRT models. Tests created with the maximum no target and maximum target item selection procedures consistently overestimated the test information function. Conversely, tests created using the theta maximum item selection procedure yielded more consistent estimates of the test information function and, at times, underestimated the test information function. Implications for test development are discussed.  相似文献   

19.
试题命制是考试的基础要素和关键环节,体现着考试作为测量手段的科学理性。试题的结构要素分别是刺激情境(线索材料)、设问(作答指令)、分值赋予、答案及评分标准等。试题命制的科学性指试题整体及其结构要素所涉及的情境素材、概念原理和推理论证等准确可靠,没有错误或者歧义。科学性维度的技术规范要求命题时首先明确测试的"构念",即测试要测的到底是被试哪方面的特质,"构念"相对抽象,需要在内容领域和认知能力等方面对"构念"进行分解使之具体化;基于测试"构念",考核重要的而非无关紧要的学习内容;其次要求试题刺激情境自身的合理性与科学性,要求试题的作答指令清晰明确无歧义,要求分值赋予合理,要求参考答案与评分标准精确并与情境素材保持逻辑一致。试题命制还需要关注试题的局部独立性。科学性是任何考试都必须遵循的基础性原则,试题命制自始至终都必须规避因科学性错误带来的测试偏差和风险。  相似文献   

20.
高中信息技术学业水平合格性考试作为标准参照性考试,命题过程需要按照考试目标及要求做好难度控制,通过准确预估试题难度控制试卷难度,实现考试结果与考试目标的一致。命题难度控制技术包括试题的难度预估、试卷难度的控制。通过确定影响难度的主要客观因素、设计简便易行的试题难度计算方法、建立试题难度预估的参照模型等三个环节探究试题难度预估的方法,结合实例进一步探究试卷难度的控制技术。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号