首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
评分教师的评分效应和评分量表研究是研究主观题评分误差的核心问题。本论文以2006年高考政治(上海卷)第38题(论述题)为例,运用ACER Conquest的Raters Effect模型研究,结果显示该大题基本没有表现出模糊性、趋中性和等级限制等评分误差,评分教师能够比较好地区分考生不同行为特征,除个别评分教师的评分一致性还有待提高外,评分松紧度差异比较显著。为此,作者提出根据松紧度调整考试分数的方法。  相似文献   

2.
本文从研究内容、研究方法两方面进行了统计分析并对反拨效应理论发展及最新负面反拨效应研究发展进行了综述。其中重点研究方向是负面反拨效应。  相似文献   

3.
主观题评分质量的估计方法评述   总被引:2,自引:0,他引:2  
在心理测量理论中,主观题的评分质量是一个值得研究的课题。本文分别介绍了三大测量理论(经典测量理论、概化理论、项目反应理论)对于主观题评分质量的估计方法,并对其优劣进行了比较。概化理论和项目反应理论在评价主观题评分质量上具有较明显的优势,如何结合使用三大理论,为主观题评分质量获取更多有价值的信息是值得深入探讨的问题。  相似文献   

4.
在普通话水平测试工作中 ,经常有同组测试员所测分数差别较大的问题。有时会相差一两分 ,有时相差三四分 ,差别大时甚至可以评定等级也不相同。特别是在等级线上的分数 ,经常出现错档现象。为什么会出现如此大的评分差别呢 ?第一 ,一些测试员缺乏必要的汉语语音理论知识。在广大测试员队伍中 ,科班出身的从事汉语教学与研究工作的内行较少 ,多数测试员来自各大、中专院校甚至小学 ,有的教语文 ,有的教数学 ,有的甚至在某些行政事业单位工作。这些测试员虽然普通话说得标准 ,但缺乏必要的汉语语音理论知识 ,缺乏较强的听音、辨音、记音能力。…  相似文献   

5.
评分者漂移是指评分员跨时间、场合或任务的行为改变,即评分者效应的波动。该构念的提出反映了研究者对评分者效应的兴趣由静态转为动态。在高利害教育考试的背景下,对评分者漂移进行检测是保障结果分数的信度、效度和考试公平性的必然要求。目前,对评分者漂移的检测主要采取基于多面Rasch模型和差异检验的传统方法。评分者漂移的模型拓展、认知与测量结合以及改进评分设计等方面值得做进一步的研究。  相似文献   

6.
根据河北省近两年试点工作的实际情况,分析了河北省测试员队伍建设的现状,提出了测试员培养过程中存在的问题,并给出了在计算机辅助测试环境下测试员队伍建设的意见和方法。  相似文献   

7.
通过对比分析10位教师评分员和10位非教师评分员,对30位考生的口语故事复述进行评分,利用t-检验和FACETS分析发现:在任务简单的评分工作中,非教师评分员和教师评分员一样可信、有效。  相似文献   

8.
高校是普通话水平测试的重点领域,计算机辅助普通话水平测试是普通话测试的新手段。本文提出测试员具有四项重要任务,即进行普通话水平测试、从事普通话教学、在全社会推广普通话和从事语言研究,并提出在计算机辅助测试背景下,测试员的工作重心由前两者向后两者转移的工作思路。本文探讨了测试员管理制度,强调了测试员应具备的能力,并着重分析了新背景下测试员工作的八个方向。  相似文献   

9.
信息技术与语言测试的结合是语言测试的发展趋势。本文以1999—2015年我国外语类主要核心期刊上发表的相关研究论文为主要依据,介绍我国计算机辅助语言测试研究的概况,并对取得的成就和存在的问题进行思考和分析。  相似文献   

10.
造成普通话水平测试员评分误差的原因及对策   总被引:2,自引:0,他引:2  
普通话水平测试(PSC)是推普工作的重要组成部分。而在测试实践中出现了测试员评分误差较大的现象,这必然影响PSC的质量,因此,应该设法减少评分误差,提高普通话水平测试的信度和效度,从PSC的理论与实践的结合上,全面而个体地分析造成测试成员评分误差的原因及应采取的对策。  相似文献   

11.
Student responses to a large number of constructed response items in three Math and three Reading tests were scored on two occasions using three ways of assigning raters: single reader scoring, a different reader for each response (item-specific), and three readers each scoring a rater item block (RIB) containing approximately one-third of a student's responses. Multiple group confirmatory factor analyses indicated that the three types of total scores were most frequently tau-equivalent. Factor models fitted on the item responses attributed differences in scores to correlated ratings incurred by the same reader scoring multiple responses. These halo effects contributed to significantly increased single reader mean total scores for three of the tests. The similarity of scores for item-specific and RIB scoring suggests that the effect of rater bias on an examinee's set of responses may be minimized with the use of multiple readers though fewer than the number of items.  相似文献   

12.
外语测试理论的形成虽然较晚,但是发展非常快。外语教学与测试密切相联,外语测试呼吁提高外语教学水平。  相似文献   

13.
1996年,全国有8所高校作为试点单位开始尝试设计开发有各校自身特色的、不局限于四、六级考试模式的大学英语水平考试。清华大学作为试点单位之一,于1996年秋季学期尝试推出了清华大学英语水平考试(Ⅰ)(简称TEPT—1),这是针对已修完大学英语基础阶段课程的清华本科生而设计的考试。TEPT—1的最大特点是大量采用主观题目来综合考核学生实际运用语言的能力,这一考试在1999年得到国家教育部的认可。本文对TEPT—1的设计开发和实施情况进行了概括介绍,对其信度、效度进行了简略评估,并对2002年4月在清华部分教师和学生中进行的有关TEPT—1的问卷调查进行了分析。  相似文献   

14.
Single‐best answers to multiple‐choice items are commonly dichotomized into correct and incorrect responses, and modeled using either a dichotomous item response theory (IRT) model or a polytomous one if differences among all response options are to be retained. The current study presents an alternative IRT‐based modeling approach to multiple‐choice items administered with the procedure of elimination testing, which asks test‐takers to eliminate all the response options they consider to be incorrect. The partial credit model is derived for the obtained responses. By extracting more information pertaining to test‐takers’ partial knowledge on the items, the proposed approach has the advantage of providing more accurate estimation of the latent ability. In addition, it may shed some light on the possible answering processes of test‐takers on the items. As an illustration, the proposed approach is applied to a classroom examination of an undergraduate course in engineering science.  相似文献   

15.
在目前广大师生对于大学英语作文部分的要求和评分体系缺乏清楚认识的前提下,本文从语言测试学的角度展示CET作文的基本要求和大学英语写作能力的实质及构成要素,对于大学英语写作教学尤其是作文的整体质量的提高有积极的推动作用。  相似文献   

16.
普通高中历史学科主观性试题是高中历史学科考试的主要题型,是实现高中历史新课程目标的最佳载体和有效形式,对于培养学生历史学科思维能力、创新能力、表达能力、学科素养具有十分重要的意义。本文对普高学生解答历史学科主观性试题存在的问题进行诊断,指出学生存在的审题、读题、组织答题、书面表达等方面的缺陷,并提出相应的解决对策,以培养和提高学生的历史学科主观性试题解题能力。  相似文献   

17.
我国英语测试发展轨迹探究   总被引:2,自引:0,他引:2  
语言测试经历了几个发展阶段,各个阶段有着不同的理论基础和基本特征.对历年来我国高考英语试题、硕士研究生入学英语考试以及大学英语考试等大规模考试题型的研究结果表明:我国语言测试的实践遵循了理论发展的脉络;目前,我国业已处于语言测试的心理语言学-社会语言学时期,诸多迹象表明交际语言测试已经初现端倪.  相似文献   

18.
语言测试的负面反拨效应与外语教学   总被引:1,自引:0,他引:1  
语言测试是检验语言教学的一种常规手段,对教学行为的双方都起着或积极、或消极的影响。从语言测试的分类、特征入手,讨论语言测试的负面反拨效应产生的实质、根源、在外语教学中的表现,以及如何避免负面反拨效应,对搞好外语教学,有一定的现实意义。  相似文献   

19.
语言测试对英语教学有着不可忽视的反拨作用,本文分析了英语等级证书考试和期末测试对高职高专英语教学的影响,以及提高其正面的反拔作用时需要注意的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号