首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
高级汉语口语测验将高水平学习者的口语能力,操作性地定义为在"听—说"模式和"独白"模式下的议论性语篇表达的能力。本研究针对评分员使用两种评分标准对67名外国考生完成"听后说"题型的评分进行了检验。概化理论的分析结果显示,两种评分标准的测验信度都达到了优良标准;评分标准一使用两名评分员即可使测验信度达到优良(概化系数为0.826),评分标准二则需要使用三名评分员才能使测验信度达到优良。  相似文献   

2.
本文从效度的四个主要方面对复述题型进行研究。讨论了复述题的构建效度和内容效度,分析了其效标关联效度和表面效度。通过对小规模复述测试,得出复述成绩与考生最近一次期末口语成绩的Pearson线性相关,以及与任课老师调整后的口语排名的Spearman等级相关。在卷面效度方面,通过分析Likert 5-Scale问卷后发现,受试者对该题型支持度较高。  相似文献   

3.
本文通过实验研究对“反复操练”进行量化分析,以个案研究探索性地考查复述练习频率对基础阶段汉语学习者口语表达流利度和正确率的影响。研究结果认为,练习频率对学习者口语表达流利度和正确率的影响是不平衡的,而不同的输入方式也影响练习频率对学习者口语提高的效用。  相似文献   

4.
随着“汉语热”的持续升温以及信息技术的不断发展,汉语学习者的学习模式也在发生变化.利用Pow-erPoint、AuthorWare等多媒体技术,以“疑问表达”为主线,构建汉语初级阶段日常交际问答互动教与学系统.这种问答互动系统由“初级阶段日常交际口语问答语料库”、“初级阶段日常交际口语问答多媒体素材库”和“初级阶段日常交际口语问答互动教、学模式”三部分组成.该研究顺应时代要求,具有较强的应用价值和推广价值.  相似文献   

5.
中小学生汉语考试,是面向第一语言非汉语的中小学生汉语学习者的国际性考试。该考试共分为三级。本文以中小学生汉语考试(二级)的实测数据为研究对象基础,讨论了中小学生汉语考试(二级)的信度与效度问题。研究结果表明,中小学生汉语考试(二级)的题目质量较好,难度控制理想,试卷结构合理,信度较高。  相似文献   

6.
PISA测验着眼于学生的终生发展,其测验编制思想给各国教育评价带来了深刻的变革。本研究在PISA阅读测验理论与框架基础上,编制了PISA式汉语阅读测验。该测验包含三篇阅读材料,共18个测验项目。通过对测验难度、区分度、信度、效度的检测,并使用全息Bifactor模型进行维度评价。结果表明,编制的PISA式汉语阅读测验难度适中,具有较好区分度,信效度基本合格。同时,基本达到PISA对阅读测验能力结构的要求,较好地考查了学生的一般阅读理解能力,以及信息提取、文本解释、反思和评价等三个子维度的能力。  相似文献   

7.
《国语入门》是赵元任先生在1948年编写的初级汉语口语教材。此教材针对美国初级水平的汉语学习者编写,深受结构主义语言学、直接法、听说法影响。《国语入门》的课文内容多元,体裁丰富,蕴含着深厚的文化知识;练习的内容、形式和数量相对合理,能够起到帮助学习者掌握学习内容的作用。《国语入门》的课文和练习安排对当代的对外汉语教学尤其是对外汉语教材的编写都具有相当大的借鉴意义。  相似文献   

8.
本文以HSK[高级]考试的实测数据为研究材料,使用结构方程模型探究高级汉语学习者听、说、读、写四项技能的结构模式以及四项技能间的融合/分散趋势。对包含一阶因子模型和高阶因子模型在内的9个理论模型的验证结果显示:高级水平汉语学习者技能结构模式可以用"听读+说+写"的形式进行描述,四项技能中听力和阅读呈现融合的趋势,相对而言,说的技能与其它技能的区分性比较高,高级水平汉语学习者听、说、读、写四项技能呈现出部分融合的趋势。研究认为,HSK[高级]考试采用主试卷、口语试卷和写作试卷三部分各自独立施测的方法 ,并将听力和阅读分数进行综合报道,口语、写作分数独立报道,这种做法具有一定的合理性。  相似文献   

9.
选择题型多用来考查词汇量、语法结构和惯用法等,属于一种封闭式题型,这种题型往往答案是固定的,十分明确的,评分客观、可靠。编制试题时除了必须符合质量测量四个指标(信度、效度、难度和区分度)外,我们还应根据本地区学生的特点,从平时的练习、家庭作业中反映出来的常见问题,有目的性的、有针对性的全面考查学生的学习情况,选择题型是最好的用来考查学生的常规武器之一,它知识覆盖面广、题量大、内容全面、小巧灵活、精干简练。  相似文献   

10.
信度和效度是衡量一个测量工具质量的关键指标,教育认知诊断测验中的信度和效度研究近年来受到研究者的关注。诊断测验的信度系数基本上源自基于α系数的属性信度系数、经验属性信度系数、四分相关系数、模拟重测一致性和分类一致性指标;效度系数主要包括模拟判准率、分类准确性和理论构想效度等。教育认知诊断测验的信度和效度研究较新,仍存在着一定的不足且缺乏全面的比较研究,更缺少系统的评价体系。  相似文献   

11.
《海外英语》2012,(3):285-286
Validity is one of the essential factors in evaluating test quality. In order to design a high-quality reading test paper, such aspects should be taken much more considerations as test specification, theoretical construct, test content and test tasks & item types.  相似文献   

12.
黄燕 《宜春学院学报》2007,29(1):166-168
口语测试是大学英语测试的一个重要组成部分。本文在介绍了大学英语口语测试的必要性后,以大学英语口语测试开发的理论为依据,致力于大学英语口语测试目的与原则、内容与形式、题型、评分等方面的研究,并提出了几点建议。  相似文献   

13.
通过问卷调查的方式对全国英语专业八级口试题型进行了评估,发现英语专业的教师和学生对现有题型基本持肯定态度,同时也提出了改进意见。在此基础上,本研究调整了部分题型,设计了一些新题型的框架和内容,并对调整后的题型进行了试点,验证了其科学性和可行性。  相似文献   

14.
本文从测试题型、试题库建设、测试方式到得出成绩报告单几个方面,综述了从纸笔测试到计算机化语言测试的发展变化。计算机化语言测试所面临的挑战以及它会利于英语学习者的信息和便捷。  相似文献   

15.
Using a technique that controlled exposure of items, the investigator examined the effect on mean test score, item difficulty index, and reliability and validity coefficients of the reordering of items within a power test containing ten letter-series-completion items. The results suggest that effects on test statistics from item rearrangement are, generally, minimal. The implication of these findings for test designs involving an item sampling procedure is that performance on an item is minimally influenced by the context in which it occurs.  相似文献   

16.
The effects of training tests on subsequent achievement were studied using 2-test item characteristics: item difficulty and item complexity. Ninety Ss were randomly assigned to treatment conditions having easy or difficult items and calling for rote or complex skills. Each S was administered two training tests during the quarter containing only items defined by his treatment condition. The dependent measure was a sixty item final examination with fifteen items reflecting each of the four treatment condition item types. The results showed greater achievement for those trained with difficult items and with rote items. In addition, two interaction of treatment conditions with type of test items were found. The results are discussed as supporting a hierarchical model rather than a “similarity” transfer model of learning.  相似文献   

17.
Item response models are finding increasing use in achievement and aptitude test development. Item response theory (IRT) test development involves the selection of test items based on a consideration of their item information functions. But a problem arises because item information functions are determined by their item parameter estimates, which contain error. When the "best" items are selected on the basis of their statistical characteristics, there is a tendency to capitalize on chance due to errors in the item parameter estimates. The resulting test, therefore, falls short of the test that was desired or expected. The purposes of this article are (a) to highlight the problem of item parameter estimation errors in the test development process, (b) to demonstrate the seriousness of the problem with several simulated data sets, and (c) to offer a conservative solution for addressing the problem in IRT-based test development.  相似文献   

18.
为保证语言测试题目的质量和加强题库建设,本文基于经典测试理论,使用Gitest Ⅲ对一份高考试卷(阅读部分)题目进行项目分析,结果显示:该阅读题目的难度、区分度较理想,但难度分布并不理想。建议在使用题库中的组合试卷前先进行试测,以改进试题的难度分布以及部分题目选项的质量,从而提高试题的信度和效度。  相似文献   

19.
曹文娟  白俊梅 《考试研究》2013,(3):79-85,33
本文使用R-2.15.2软件模拟研究锚测验难度参数方差特征对测验等值误差的影响,采用三种等值方法(链百分位等值法、Levine等值法和Tucker等值法)对锚测验不同类型的难度方差进行比较研究。结果显示,当锚测验难度方差小于全测验难度方差时,其等值的随机误差和系统误差与锚测验难度方差和全测验难度方差一致时(即锚测验为全测验的平行缩减版minitest时)的表现基本相同。因此,对锚测验而言,要求其与全测验具有相同的统计规格可能过于严格。  相似文献   

20.
This article considers potential problems that can arise in estimating a unidimensional item response theory (IRT) model when some test items are multidimensional (i.e., show a complex factorial structure). More specifically, this study examines (1) the consequences of model misfit on IRT item parameter estimates due to unintended minor item‐level multidimensionality, and (2) whether a Projection IRT model can provide a useful remedy. A real‐data example is used to illustrate the problem and also is used as a base model for a simulation study. The results suggest that ignoring item‐level multidimensionality might lead to inflated item discrimination parameter estimates when the proportion of multidimensional test items to unidimensional test items is as low as 1:5. The Projection IRT model appears to be a useful tool for updating unidimensional item parameter estimates of multidimensional test items for a purified unidimensional interpretation.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号