期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

杨志明丁港王雯《教育测量与评价(理论版)》2021,(1):44-48

测评信度是衡量考试质量的核心指标之一,但常规的信度估计方法在估计含有单个高计分主观题试卷的信度时并不恰当,因为这种高计分主观题对测验总分方差的影响太大。解决这种问题的一个做法是:在估计出单个高计分主观题信度的基础上,进一步运用分层α系数公式估计整个试卷的测评信度。单个高计分主观题信度的估计方法有两种,即使用重测信度的估计方法,或者使用根据两个随机变量的相关系数会因随机误差的存在而衰减的特点所提出的估计方法。相似文献

2.

用验证性因子分析估计单维测验的信度

叶宝娟杨强《教育测量与评价(理论版)》2011,(11):8-12

α系数可能会高估或低估单维测验的信度,用验证性因子分析可以更好地估计单维测验的信度。本文介绍并比较了用验证性因子分析估计单维测验信度的4个信度系数：合成信度、最大信度、RΛ系数、RT系数,并通过比较,推荐应用者在不同的情况下,用合适的信度系数估计单维测验的信度。相似文献

3.

考试实测数据三种信度估计方法的比较

周学路任杰《考试研究》2022,(6):32-39

基于某考试实测数据,采取随机抽样和控制变量相结合的方法对α系数、β系数和γ系数在不同的被试同质性和分数分布形态条件下的特点进行比较和验证。结果表明,对于题目同质性程度较高的测验而言,β系数减小了题目同质性对信度估计的影响,得到了比α系数普遍稍高的信度估计值,但存在与α系数相同的不足,即受被试同质性影响较大;γ系数与后二者的估计结果差距略大,但减小了被试同质性对信度估计的影响,具有比α系数和β系数更强的稳定性。相似文献

4.

考试数据的相关性分析

李付鹏《中国考试》2009,(5)

数据的相关性分析是考试数据统计的一个重要方面,本文以Cronbachα信度系数和Pearson相关系数为理论基础,对组成试卷的各测试子目标之间以及各测试子目标与试卷总体测试目标之间的相关性作了分析,指出了该方法具体运用的可行性以及实际应用时需要注意的一些问题。相似文献

5.

几种估计信度公式的对比研究

陈希镇《上海教育科研》1991,(1)

引言在教育和心理测验中,信度的重要性正被越来越多的人所重视。在经典测验理论中,信度的定义有两种,其一是用两份平行测验的相关系数作为信度的定义,另一是用真分数方差与观测分数方差之比来定义。由于编制两份完全平行的测验实际上难以做到,而学生的真分数又是个不可观测量,因此,上面的信度定义只是理论上构想的概念,在实际应用时必须根据一组实得分数采用一些变通方法加以估计。到目前为止,根据一份测验结果来估计信度的相似文献

6.

中考物理命题基本思路与做法

《中学教学参考》2017,(35)

编制一份高质量的中考物理试卷,是广大师生都关切的问题。其实,一份好的物理试卷要根据考试的性质、课程标准、物理教材、教学实际和学生实际来制作,具体技术指标有:难度、效度、信度、区分度。文章结合作者多年的命题经验,从五个方面进行分析。相似文献

7.

浅谈试卷的信度与效度

杨玉桓汪波雷颜萍李秀玉《天津教育》1988,(11)

测验或考试的命题质量如何,能否对考生的知识程度和能力进行有效的测量,除了上一讲介绍的试题难度和区分度知识外,还需要对试卷做整体分析,试卷整体分析的指标主要是信度和效度。一、信度信度是指测验结果的可靠程度,它是表明测验稳定性、可靠性的重要指标。如果考试的成绩与学生的真实水平完全一致,我们说此考试的信度最大,或者说,这次考试完全可靠。信度可用相关系数来表示,称为信度系数。其数值介于-1与+1之间,在标准化考试中,一般要求信度值达0.9以上。 (一)信度的种类及其计算方法 1.分半信度。此种信度表示法应用广泛。它只需用同一张试卷对同一批学生进行一次测试。具相似文献

8.

多种测量信度观与自学考试信度分析

田霖韦小满王桥影《教育与考试》2013,(2):21-25

信度是衡量测量结果稳定性与可靠性的重要指标,反映了测量过程中对误差控制能力的大小。信度分析是自学考试试题评价的重要内容,包括测量分数信度分析与及格线决策信度分析。本文简要介绍了CTT信度观、GT信度观及IRT信度观的理论内容与信度分析方法,并对三种测量信度观进行比较。本文提出,自学考试的信度分析工作应结合具体课程的考试特点、试卷结构、考试作答数据类型等因素,同时考虑CTT、GT、IRT三种信度观的优势及信度估计方法的应用条件,根据具体研究目的选择最恰当的或综合运用不同的信度分析方法。相似文献

9.

临床医学五年制“诊断学”试卷分析及教学策略改进

罗艳婷周汉建周彬谢旭晶《科教导刊》2023,(13):45-48

目的：评估“诊断学”理论考试卷的质量,基于试卷分析改进教学策略以提高教学质量。方法：汇总中山大学2018级临床医学专业“诊断学”理论考卷177份,采用SPSS 26.0进行试卷分数的频数、均数、信度和效度统计,分别计算试题的难度及区分度。根据试卷信度、效度、难度级区分度进行试卷质量分析,并基于试卷分析提出教学策略改进方案。结果：177名学生的考试成绩为34.5～84.0分,平均为62.23±10.66分。试卷总体信度（?）为0.778,总效度（V）为0.534,总体难度（P）为0.622,区分度（D）为0.52;学生总失分率为：38%。结论：本次考试试卷难度偏难,效度偏低,信度及区分度良好。学生在知识灵活应用方面掌握欠佳,需根据试卷分析情况,改进教学策略,以提高教学效果。相似文献

10.

心理与教育测量若干概念的应用问题 总被引：4，自引：0，他引：4

熊广星《广西师范大学学报(哲学社会科学版)》2000,36(3):63-65

心理与教育测量概念的应用要符合科学性：（一）用决定系数解释成因不能忽视共变关系,要估计到研究结论可能存在的片面性;（二）区分度不适用于大题作鉴别力指标,满分不同的题目也不宜作区分度比较;（三）用内部一致性系数估计信度须以任意两个被试对测验要测的各部分知识内容掌握程度的差别基本相同这一假设为前提,该假设不符合被试的真实状况,使得用内部一致性系数估计信度必然偏低。相似文献

11.

基于信度分析对电视节目“爱情三十六计”开办的调查研究

雷燕《现代企业教育》2011,(12):161-162

信度是反映电视节目质量优劣的重要指标之一。本文通过问卷调查的形式利用克朗巴哈α系数法和折半信度法对昆明电视台“爱情三十六计”是否继续开办进行了分析。结果为：克朗巴哈α系数为0．894;折半信度前四项克朗巴哈α系数值为0．944,后三项克朗巴哈α系数值为0．826,均大于0．8。即总体上“爱情三十六计”具有良好的信度,应当继续开办。相似文献

12.

偏态分布下多维测验合成信度区间估计的比较

叶宝娟杨强《教育测量与评价(理论版)》2014,(11)

用合成信度能比α系数更准确地估计测验的合成信度。本文用模拟研究比较了两种估计多维测验合成信度置信区间的方法,结果发现用Delta法通过近似计算得到的标准误,与Bootstrap法的结果差别很小,而且比Bootstrap法简单得多,因此推荐使用Delta法估计多维测验合成信度的置信区间。相似文献

13.

有关试题分析、试卷分析和教学分析的统计指标

陈守雄李明伟《洛阳工业高等专科学校学报》2000,(2)

教师组编一份试卷用于考试后,得到考生考试的成绩数据,这些数据在很大的程度上反映了试卷的质量和教学的状况。根据数理统计知识对这些成绩资料分析计算,从中得出有关试题分析、试卷分析和教学分析等方面的统计指标。根据这些指标,可更准确、更深刻地了解到诸如试卷难度是否合适及试题是否能区分被试者的能力等这一类的问题。有关试题分析、试卷分析和教学分析的统计指标分别介绍如下。１试卷的统计分析指标若一份试卷的ｍ道题目为（即ｇｍ表示试卷中的第ｍ道试题）,用这份试卷进行测试的ｎ位考生为Ｓ１……Ｓｎ考生Ｓｉ在题目ｇｋ上… 相似文献

14.

科学、合理、规范是命题工作的关键要素

王晓珉《现代远程教育研究》2004,(4):37-39

科学，合理，规范，是考试命题工作的关键要素；试卷的信度和效度，是测量考试质量的重要标准。文章根据电大学生的特点，提出编制一份科学的试卷应该注意的问题。相似文献

15.

多元概化理论在高等教育自学考试命题质量控制中的应用——以北京市《英语水平考试（一）笔试》为例

田霖王桥影赵晓茫《考试研究》2012,(3):57-64

概化理论作为新一代测量理论逐渐应用于大规模考试领域。文章运用多元概化理论对自学考试课程《英语水平考试（一）笔试》试卷的测量信度、试卷总分合成、及格线决策信度、试卷结构优化等问题进行探讨。研究发现：本次考试的测量信度较高;各分测验对全域总分的方差贡献比例与试卷赋分意图基本一致;该试卷以60分作为及格线具有较高的决策信度;将各分测验题量同时增至15题或单独将词汇分测验题量增至20题,可有效提高测量信度。相似文献

16.

α系数受考生能力分布范围影响的研究

余嘉元《上海教育科研》1990,(4)

一在经典测量理论中,人们已经认识到,测验结果的信度会受到考生分数分布范围的影响。考生分数的分布范围越大,信度系数也越大。但人们在阐述这个问题时,一般都是以相关系数为例来说明的,因为相关系数会受到变量取值范围的影响,而有些信度系数也正是用相关系数来表示的,例如:重测信度、复本信度和分半信度,因此,认为这些信度系数将受到分数分布范围的影响,这显然是合理的。但是,目前我国的许多教育测量工作者,还经常采用α系数表示测验结果的信度,α系数是一相似文献

17.

基于充分统计量的一种枢轴量构造方法

李万斌《四川教育学院学报》2010,26(11):107-108,116

通过分析构造枢轴量进行置信区间估计的过程,说明参数估计中优良的点估计与区间估计的关系。在此基础上,根据Lehmann-Sheffe定理说明充分统计量在构造枢轴量进行置信区间估计时的作用,指出了在进行置信区间估计时利用充分统计量构造枢轴量的有效途径。相似文献

18.

英语测试和英语教学

《高等教育与学术研究》2007,(4)

效度、信度和区分度是评价一份试题好坏的三个重要标准,而测试质量的高低对教学过程的反作用又是巨大的。针对目前我国大学英语考试中存在的一些现象,我们试图用由试题的效度、信度和区分度等决定的试卷质量及其与教学的关系来对我们的英语考试与教学提出一些看法和建议。相似文献

19.

技工学校的考试及考试命题

段景华《职业教育研究》1997,(3)

本文仅对技工学校考试试题的效度与信度及考试试题的命题原则作初步探讨一、考试试题的效应与信度一份高质量的试卷，其试题必须是高效度和高信度的。效度与信度既有明显的区别，又有密切的联系。效度可以认为是在测试时最重要的标准参数。它是指在测试时，试题能够测量其所测量的对象（学生）对所学知识掌握的程度。程度越高，则效度越高，反之则低。如果一份试卷的试题不能够客观地检查出学生对某一科自知识掌握的程度（或程度很低），那么这份试卷在命题上就是失败的。对效度的高低，我们可以从两个方面去看：其一是课程的效度，其二是统… 相似文献

20.

怎样评估试卷质量

高福贵《中小学管理》1989,(1)

考试之后,教师或学校有关部门应对试卷命题质量进行评估。如果采用定性分析的方法,则难以说明问题。如果采用统计学方法对试卷进行定量分析,评估才会得出科学的结论。因为,数据是最有说服力的。分析试卷命题的质量,一般要分析其信度、区分度和难度。统计学原理要求,进行统计分析的样本愈大,统计结果越科学。这里我们只假定随机抽相似文献