共查询到20条相似文献,搜索用时 15 毫秒
1.
测评信度是衡量考试质量的核心指标之一,但常规的信度估计方法在估计含有单个高计分主观题试卷的信度时并不恰当,因为这种高计分主观题对测验总分方差的影响太大。解决这种问题的一个做法是:在估计出单个高计分主观题信度的基础上,进一步运用分层α系数公式估计整个试卷的测评信度。单个高计分主观题信度的估计方法有两种,即使用重测信度的估计方法,或者使用根据两个随机变量的相关系数会因随机误差的存在而衰减的特点所提出的估计方法。 相似文献
2.
α系数可能会高估或低估单维测验的信度,用验证性因子分析可以更好地估计单维测验的信度。本文介绍并比较了用验证性因子分析估计单维测验信度的4个信度系数:合成信度、最大信度、RΛ系数、RT系数,并通过比较,推荐应用者在不同的情况下,用合适的信度系数估计单维测验的信度。 相似文献
3.
基于某考试实测数据,采取随机抽样和控制变量相结合的方法对α系数、β系数和γ系数在不同的被试同质性和分数分布形态条件下的特点进行比较和验证。结果表明,对于题目同质性程度较高的测验而言,β系数减小了题目同质性对信度估计的影响,得到了比α系数普遍稍高的信度估计值,但存在与α系数相同的不足,即受被试同质性影响较大;γ系数与后二者的估计结果差距略大,但减小了被试同质性对信度估计的影响,具有比α系数和β系数更强的稳定性。 相似文献
4.
数据的相关性分析是考试数据统计的一个重要方面,本文以Cronbachα信度系数和Pearson相关系数为理论基础,对组成试卷的各测试子目标之间以及各测试子目标与试卷总体测试目标之间的相关性作了分析,指出了该方法具体运用的可行性以及实际应用时需要注意的一些问题。 相似文献
5.
引言在教育和心理测验中,信度的重要性正被越来越多的人所重视。在经典测验理论中,信度的定义有两种,其一是用两份平行测验的相关系数作为信度的定义,另一是用真分数方差与观测分数方差之比来定义。由于编制两份完全平行的测验实际上难以做到,而学生的真分数又是个不可观测量,因此,上面的信度定义只是理论上构想的概念,在实际应用时必须根据一组实得分数采用一些变通方法加以估计。到目前为止,根据一份测验结果来估计信度的 相似文献
6.
7.
测验或考试的命题质量如何,能否对考生的知识程度和能力进行有效的测量,除了上一讲介绍的试题难度和区分度知识外,还需要对试卷做整体分析,试卷整体分析的指标主要是信度和效度。一、信度信度是指测验结果的可靠程度,它是表明测验稳定性、可靠性的重要指标。如果考试的成绩与学生的真实水平完全一致,我们说此考试的信度最大,或者说,这次考试完全可靠。信度可用相关系数来表示,称为信度系数。其数值介于-1与+1之间,在标准化考试中,一般要求信度值达0.9以上。 (一)信度的种类及其计算方法 1.分半信度。此种信度表示法应用广泛。它只需用同一张试卷对同一批学生进行一次测试。具 相似文献
8.
9.
目的:评估“诊断学”理论考试卷的质量,基于试卷分析改进教学策略以提高教学质量。方法:汇总中山大学2018级临床医学专业“诊断学”理论考卷177份,采用SPSS 26.0进行试卷分数的频数、均数、信度和效度统计,分别计算试题的难度及区分度。根据试卷信度、效度、难度级区分度进行试卷质量分析,并基于试卷分析提出教学策略改进方案。结果:177名学生的考试成绩为34.5~84.0分,平均为62.23±10.66分。试卷总体信度(?)为0.778,总效度(V)为0.534,总体难度(P)为0.622,区分度(D)为0.52;学生总失分率为:38%。结论:本次考试试卷难度偏难,效度偏低,信度及区分度良好。学生在知识灵活应用方面掌握欠佳,需根据试卷分析情况,改进教学策略,以提高教学效果。 相似文献
10.
心理与教育测量若干概念的应用问题 总被引:4,自引:0,他引:4
熊广星 《广西师范大学学报(哲学社会科学版)》2000,36(3):63-65
心理与教育测量概念的应用要符合科学性:(一)用决定系数解释成因不能忽视共变关系,要估计到研究结论可能存在的片面性;(二)区分度不适用于大题作鉴别力指标,满分不同的题目也不宜作区分度比较;(三)用内部一致性系数估计信度须以任意两个被试对测验要测的各部分知识内容掌握程度的差别基本相同这一假设为前提,该假设不符合被试的真实状况,使得用内部一致性系数估计信度必然偏低。 相似文献
11.
信度是反映电视节目质量优劣的重要指标之一。本文通过问卷调查的形式利用克朗巴哈α系数法和折半信度法对昆明电视台“爱情三十六计”是否继续开办进行了分析。结果为:克朗巴哈α系数为0.894;折半信度前四项克朗巴哈α系数值为0.944,后三项克朗巴哈α系数值为0.826,均大于0.8。即总体上“爱情三十六计”具有良好的信度,应当继续开办。 相似文献
12.
用合成信度能比α系数更准确地估计测验的合成信度。本文用模拟研究比较了两种估计多维测验合成信度置信区间的方法,结果发现用Delta法通过近似计算得到的标准误,与Bootstrap法的结果差别很小,而且比Bootstrap法简单得多,因此推荐使用Delta法估计多维测验合成信度的置信区间。 相似文献
13.
教师组编一份试卷用于考试后,得到考生考试的成绩数据,这些数据在很大的程度上反映了试卷的质量和教学的状况。根据数理统计知识对这些成绩资料分析计算,从中得出有关试题分析、试卷分析和教学分析等方面的统计指标。根据这些指标,可更准确、更深刻地了解到诸如试卷难度是否合适及试题是否能区分被试者的能力等这一类的问题。有关试题分析、试卷分析和教学分析的统计指标分别介绍如下。1试卷的统计分析指标 若一份试卷的m道题目为(即gm表示试卷中的第m道试题),用这份试卷进行测试的n位考生为S1……Sn考生Si在题目gk上… 相似文献
14.
王晓珉 《现代远程教育研究》2004,(4):37-39
科学,合理,规范,是考试命题工作的关键要素;试卷的信度和效度,是测量考试质量的重要标准。文章根据电大学生的特点,提出编制一份科学的试卷应该注意的问题。 相似文献
15.
16.
一在经典测量理论中,人们已经认识到,测验结果的信度会受到考生分数分布范围的影响。考生分数的分布范围越大,信度系数也越大。但人们在阐述这个问题时,一般都是以相关系数为例来说明的,因为相关系数会受到变量取值范围的影响,而有些信度系数也正是用相关系数来表示的,例如:重测信度、复本信度和分半信度,因此,认为这些信度系数将受到分数分布范围的影响,这显然是合理的。但是,目前我国的许多教育测量工作者,还经常采用α系数表示测验结果的信度,α系数是一 相似文献
17.
李万斌 《四川教育学院学报》2010,26(11):107-108,116
通过分析构造枢轴量进行置信区间估计的过程,说明参数估计中优良的点估计与区间估计的关系。在此基础上,根据Lehmann-Sheffe定理说明充分统计量在构造枢轴量进行置信区间估计时的作用,指出了在进行置信区间估计时利用充分统计量构造枢轴量的有效途径。 相似文献
18.
《高等教育与学术研究》2007,(4)
效度、信度和区分度是评价一份试题好坏的三个重要标准,而测试质量的高低对教学过程的反作用又是巨大的。针对目前我国大学英语考试中存在的一些现象,我们试图用由试题的效度、信度和区分度等决定的试卷质量及其与教学的关系来对我们的英语考试与教学提出一些看法和建议。 相似文献
19.
本文仅对技工学校考试试题的效度与信度及考试试题的命题原则作初步探讨一、考试试题的效应与信度一份高质量的试卷,其试题必须是高效度和高信度的。效度与信度既有明显的区别,又有密切的联系。效度可以认为是在测试时最重要的标准参数。它是指在测试时,试题能够测量其所测量的对象(学生)对所学知识掌握的程度。程度越高,则效度越高,反之则低。如果一份试卷的试题不能够客观地检查出学生对某一科自知识掌握的程度(或程度很低),那么这份试卷在命题上就是失败的。对效度的高低,我们可以从两个方面去看:其一是课程的效度,其二是统… 相似文献