首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
建立小型描述语语料库并参考MHK三级口试评分标准,对达到MHK三级水平的考生进行"能做什么"的描述分析,建立MHK三级口语能力评分量表。教师给出本班每位参加MHK三级口试学生的口语能力等级,以此为效标计算考生MHK口试成绩和教师评价间的相关等。将分析结果作为论证支撑(backing),以Toulmin效度论证模型为理论框架,从实证角度对少数民族汉语水平考试(MHK)的外推(extrapolation)阶段进行效度论证。结果显示:MHK三级口试效度论证的外推(extrapolation)阶段基本成立,考生的MHK三级口试成绩可以反映考生在实际汉语交际环境中口语能力的表现。  相似文献   

2.
MHK(中国少数民族汉语水平考试)计算机网络考试有助于教学单位建立大规模的测试题库、提升MHK口语考试的效率,可实现网络阅卷和评分,集学习、辅导和测试于一体,能为教学单位提供大数据分析功能。基于此,少数民族地区教育部门应大规模推广MHK计算机网络考试,提升广大教师的教育测量理论水平,做好MHK计算机网络考试的使用培训,建立一套科学的评价系统。  相似文献   

3.
张晋军  任杰 《中国考试》2004,(10):27-32
根据《汉语测试电子评分员研究设想》(以下简称《研究设想》)提出的研究思路,我们随机选取了700份中国少数民族汉语水平等级考试(MHK)三级作文预测卷,由3位评分员严格按照MHK(三级)作文评分要求进行独立评分。设计、编写电子评分员程序,由电子评分员对这700份作文的电子文件进行评分。随后计算电子评分员  相似文献   

4.
选取MHK口语试题实测数据,运用多面Rasch模型的理论和方法对人工评分与计算机自动评分的严厉程度、评分员内部以及各评分员之间的一致性程度进行研究,分析了两种评分方式在严厉度、一致性等方面存在的具体差异,以及不同试题之间是否存在难度差异,希望据此为提高MHK阅卷的科学化水平及命题质量提供依据和建议。  相似文献   

5.
随着汉语在少数民族中的地位越来越高和近年来教育部对少数民族学生汉语能力考察的加强,尤其是对少数民族学生汉语写作能力的考察,维族双语班学生的汉语写作课堂教学也更加重要.本文基于MHK(三级)考试要求下对MHK(三级)写作考试、维族双语班学生汉语写作课教学现状进行分析,提出了MHK(三级)写作能力提升的相应措施.并以此来进行课堂教学改革,从而提高维族双语班学生的汉语写作能力.  相似文献   

6.
根据普通话水平测试与中国少数民族汉语水平等级考试(MHK)词汇(三级)的相关性,提出将普通话训练与MHK口试训练融合的建议。通过对普通话训练和MHK(三级)口语考试词汇教学重点进行详细解读,提出具体教学策略,以切实提高新疆少数民族学生国家通用语言文字运用能力。  相似文献   

7.
我国已在部分民族地区开展全国少数民族汉语水平考试(MHK)。据了解,MHK从低级到高级,共分为四个等级:一级为评价小学毕业生汉语水平的依据;二级为评价考生能否适应全日制民族高级中学和中等专业学校学习汉语的依据;三级为评价汉语授课的普通高等学校招收少数民族应考者汉语水平的依据;四级为评价少数民族大学本科毕业生汉语水平的依据。经考试达到相应等级标准者,可授予相应的等级证书。按有关规定,今后,获得MHK三级证书的学生可以不经过预科学习而直接进入大学接受汉语授课,MHK三级证书是普通高等学校民族预科生汉语结业的标准。获得…  相似文献   

8.
媒体撷英     
《中国考试》2006,(10):61-61
全国英语等级考试首次采用“人机对话”形式本月9、10两日结束的全国英语等级考试(PETS)中,一种新颖的人机对话式的口语考试方式首次得到应用。考生在登陆到这种新的“计算机辅助口语考试系统”后,将直接与动画虚拟的考试场景中的人物展开对话,从而完成考试任务。在此次PETS-1级考试中,天津市全部考点以及福建省的部分考点率先采用了这种计算机辅助口语考试形式。16日,这两个地区完成了口试录音的网上阅卷工作。整个考试和阅卷过程进展顺利,监考人员、评分教师以及考生对这一新的考试形式普遍表示欢迎。  相似文献   

9.
我国首次开展的全国少数民族汉族水平考试(MHK)2003年12月17日在吉林省开考。据了解,MHK从低级到高级,共分为四个等级:一级为评价小学毕业生汉语水平的依据;二级为评价考生能否适应全日制民族高级中学和中等专业学校学习汉语的依据;三级为评价汉语授课的普通高等学校招收少数民族应考者汉语水平的依据;四级为评价少数民族大学本科毕业生汉语水平的依据。经考试达到相应等级标准者,可被授予相应的等级证书。按有关规定,今后,获得MHK三级证书的学生可以不经过预科学习而直接进入大学接受汉语授课,是普通高等学校民族预科生汉语结业的标准…  相似文献   

10.
张洁 《考试研究》2008,(4):65-78
口语考试作为一种相对真实(authentic)和直接(direct)的测试手段,已被越来越广泛地应用于语言测试实践中。然而,在测试过程中引入的主观判断、评分标准和量表的设计与使用等因素,使分数受到更多考生能力以外因素的影响。本研究基于2007年某考点PETS三级口语考试数据,用多侧面Rasch模型(Many-facet Rasch Model,简称MFRM)对这次考试的评分进行了事后质量控制研究。MFRM将语言运用测试多方面因素综合在一个数学模型中,不仅能够把所有侧面在同一标尺下进行衡量,还能对单独侧面,甚至每个个体进行具体分析,有针对性地找到潜在的"问题评分员"和可能被误判的考生,是主观评分环节有效的质量监控手段。  相似文献   

11.
计算机自动评分(CAS)用于自学考试外语类课程的翻译测验评分,能够有效提高评分效率及客观性。本研究对72名自考学习者翻译测验作答数据的计算机自动评分结果与人工评分结果进行相关分析及配对样本t检验,并将两种评分方式的诊断结果进行比较。研究发现,计算机自动评分与人工评分结果高度相关,两种评分方式的翻译测验总分无显著差异,总体而言本次翻译测验自动评分结果是可靠的;但计算机自动评分与人工评分对自考学习者的翻译能力结构诊断结果有一定差异。  相似文献   

12.
This study investigated the interrater reliability of teachers' and school psychology ex-terns' scoring of protocols for the Developmental Test of Visual-Motor Integration (VMI). Previous studies suggest that the scoring criteria of the VMI are ambiguous, which when coupled with raters' lack of scoring experience, as well as limited knowledge of testing issues, contributes to low rater reliability. The original manual scoring system was used by four trained teachers with no VMI experience and by four experienced raters. A VMI scoring system, revised to eliminate ambiguous scoring criteria, was used by an additional four teachers inexperienced with the VMI and by four experienced raters. High reliability coefficients (>.90) were found for all raters, regardless of the scoring system employed. The influence on interrater reliability of factors such as training, nature of the training setting, characteristics of the raters, and ambiguity of scoring criteria is discussed.  相似文献   

13.
会计电算化实验教学体系的构建与应用   总被引:10,自引:1,他引:10  
按照会计专业应用型人才的培养目标,在教学中加大会计电算化实验教学环节,围绕课程与专业设置三个层次的实验教学体系,一是与会计电算化课程相结合的基础实验;二是与会计专业知识相结合的模拟实验;三是与手工操作相结合的仿真实务系统实验,之后引导学生撰写课程论文,并组织学生参加职业资格认定考核。全面培养了学生对会计专业课程的应用与研究能力。  相似文献   

14.
Martin   《Assessing Writing》2009,14(2):88-115
The demand for valid and reliable methods of assessing second and foreign language writing has grown in significance in recent years. One such method is the timed writing test which has a central place in many testing contexts internationally. The reliability of this test method is heavily influenced by the scoring procedures, including the rating scale to be used and the success with which raters can apply the scale. Reliability is crucial because important decisions and inferences about test takers are often made on the basis of test scores. Determining the reliability of the scoring procedure frequently involves examining the consistency with which raters assign scores. This article presents an analysis of the rating of two sets of timed tests written by intermediate level learners of German as a foreign language (n = 47) by two independent raters who used a newly developed detailed scoring rubric containing several categories. The article discusses how the rubric was developed to reflect a particular construct of writing proficiency. Implications for the reliability of the scoring procedure are explored, and considerations for more extensive cross-language research are discussed.  相似文献   

15.
主观题评分标准研究   总被引:1,自引:0,他引:1  
本文以2006年上海市高考政治学科论述题评分标准为例,从三个方面研究如何评价主观题评分标准的优劣,即每个评分项是否具有相对独立性;根据若干评分项的结果是否能够推测出考生的综合论述的能力;每个评分项等第划分是否合理。因子分析表明该主观题四个评分项具有单维性,一个因子可以解释为考生的综合论述能力。相关分析表明四个评分项均具有相对独立性,对推测考生的综合论述能力起到了彼此独立的作用。Rasch评分量表模型分析显示,各评分项等级划分基本合理,但个别等级出现信息量不足,在此基础上,提出了改进评分标准的若干建议。  相似文献   

16.
以C语言上机考试系统的自动评分模块为例,介绍和分析了各种题型的评分策略及此关键技术的解决方案,并给出了部分源代码.针对传统的编程题自动评分方法以结果论成败,不符合教师人工阅卷习惯的问题,提出了一种基于程序理解的动态测试与静态分析组合方法的编程题评分策略,该方法适用于考察考生对程序算法和关键语义的正确理解,使得评分结果更加符合人工阅卷的思维过程.  相似文献   

17.
评分是影响口语考试信、效度的重要因素。口语考试的评分方法可以分为主观评分和客观或半客观评分两种。前者主要有总体等级评分和分项等级评分,后者主要有机器评分、分项客观指标评分和0/1制评分。本文对这几种评分方法进行了梳理和总结,并指出了每种评分方法的优劣。文章还对评分方法与口语能力定义、评分方法的选择以及评分与测验效度的关系等问题进行了讨论。  相似文献   

18.
Abstract

This study investigated the reliability, validity, and utility of the following three measures of letter-formation quality: (a) a holistic rating system, in which examiners rated letters on a five-point Likert-type scale; (h) a holistic rating system with model letters, in which examiners used model letters that exemplified specific criterion scores to rate letters; and (c) a correct/incorrect procedure, in which examiners used transparent overlays and standard verbal criteria to score letters. Intrarater and interrater reliability coefficients revealed that the two holistic scoring procedures were unreliable, whereas scores obtained by examiners who used the correct/incorrect procedure were consistent over time and across examiners. Although all three of the target measures were sensitive to differences between individual letters, only the scores from the two holistic procedures were associated with other indices of handwriting performance. Furthermore, for each of the target measures, variability in scores was, for the most part, not attributable to the level of experience or sex of the respondents. Findings are discussed with respect to criteria for validating an assessment instrument.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号