期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李凌艳辛涛董奇《北京师范大学学报(社会科学版)》2007,(6):19-25

从上世纪五六十年代开始,由于一些大型国际教育测评项目的推动,矩阵取样技术因其较好地解决了广泛的测试内容和有限的测试时间之间的矛盾,而在大尺度教育测评中逐渐得到普遍运用。它通过将测验题目的随机平行等份分配给随机选取的学生来估计测验总分,是用来估计矩阵参数的一般统计方法。在实际测评的过程中,与传统经典测验用同一张试卷测验所有学生的做法不同,矩阵取样通过限制每个学生所接受的测验题目数量来减少必须的测验时间,但同时仍然在学生之间保持了对测试内容的广泛覆盖范围。从基本类型上看,它可分为完全矩阵取样和不完全矩阵取样两大类,两者都定位于对群体水平的测查,但后者通过"公用题目"的设计帮助解决个体间结果比较的问题。采用恰当的矩阵取样技术,在对广泛的测评内容进行梳理和结构化整理的基础上,可以在不增加测验管理成本的前提下,实现对群体水平的准确、全面考察,这对我国教育质量监测工作的开展具有重大的方法学意义。相似文献

2.

郑州市学业评价分析报告系统的开发与应用

高燕《教育测量与评价(理论版)》2015,(3):19-23

测验结果报告和使用的科学性是学业评价科学性的重要组成部分.传统的测试结果呈现和使用方式不利于对测试本身价值的进一步挖掘,为解决这一问题,河南省郑州市教研室开发了面向多群体的“郑州市学业评价分析报告系统”.该系统以《教育与心理测量标准》与“考试结果报告的八个关键特征框架”为开发思路,以建立基于课程标准的命题规范流程为分析报告的基础,考虑了市级教育管理者、校长、班主任、学科教师、学生等的不同需求,从测验概况、科目水平、题目水平三个层次呈现测试情况.它在一定程度上驱动了教育决策、积累了大量测试数据,发挥了评价促进教学的功能,引导各方树立了正确的学业质量现和评价观,但在报告内容、报告功能等方面还需做进一步改进. 相似文献

3.

教师自编化学学力测验的专业准备工作

《考试周刊》2016,(46)

老师的自编检测是老师在教学的不同阶段依据不同的教学任务和教学目的编制不同的教学测试。这种自编测试有着不同的测试目的,如合格测试要具有很高的内容效度;用来选拔的择优测验需要较难度的测试题目;难度测验由于要检测学生这一阶段的学习水平,因此老师要根据这一阶段的学习内容进行测试内容的安排;测试内容较全面的测试则是将大量的知识点聚集在此测试之中,这种测试内容的难度不大,而且知识点一般以选择题和填空题的形式出现,能够较全面地检测学生的学习效果。教师的自编学力测验对老师的系统教学和学生学习知识的检测和巩固具有重要意义,本文就以教师自编化学学力测验的专业准备工作进行探究。相似文献

4.

基于UML的题库题目的难度智能修正实现

温子梅《广东教育学院学报》2005,25(3):107-109

根据教育测量学的题库建设理论，通过组织测验样本，对题库题目进行预先测试，运用题目统计分析技术的有关算法，可以获得测验题目的难度值、区分度等相关技术参数．运用计算机的UML统一建模技术，构建题库题目难度的智能修正模型，可以实现题库中大量题目难度值的智能化运算和修正工作，从而进一步保证计算机题库建设的科学性．相似文献

5.

英语测试中选择题型对学习者的负面影响及相关对策

黄河《湖北第二师范学院学报》2008,25(12):112-114

我国大多英语测试题型结构以客观性试题的设置为主，其中选择—反应测验题目占据了最大比例。然而由于以选择—反应测试题目为主的英语考试对学生学习成就测量的准确性不足，这种英语测试题对学生的学习动机、学习方法、学习效果等有较大负面影响，因此英语测试题目设置应当进行针对性的进行改革。相似文献

6.

改进普通话测试的概化理论分析 总被引：4，自引：0，他引：4

杨志明张雷《湖南师范大学教育科学学报》2003,2(1):76-82

根据概化理论的原理和方法，讨论了普通话测试的测验设计问题。研究发现，国家语委实施的普通话测验从总体上说具有较高的信度。其中，测验的第一和第二部分的信度要高一些，而第三部分的信度要低一些。改进测验设计的首要方法是提高分测验三的信度。具体来说，评分者个数为2、题目数量为25是一个最低要求的设计方案。若要求信度值较高（如Eρ^2＝0．60以上），则宜选择评分者个数为2、题目个数接近50，或评分者个数为3、题目个数大于30的测量设计。相似文献

7.

使用逐步CM曲线法检验测验单维性

《考试研究》2020,(3)

单维性是传统项目反应理主化重要的结构假设。单维性检验是运用项目反应理论进行数据分析的重要环节。本文介绍一种基于Cronbach’sα系数的简便的单维性检验方法,对其原理、操作过程和结果进行详细解释。在测验编制阶段,通过该方法分析测验题目的结构、内容,能够对测验题目优化、修改提供有益参考。相似文献

8.

课程测验项目分析方法——以对外汉语课程测验为例

张军《考试研究》2013,(4):68-75

对外汉语课程测验属于标准参照性测验,应使用标准参照性测验理论体系下的技术指标对测验进行项目分析和评价,传统的分析方法（如区分度）不完全适用于课程测验的项目分析。本文使用该理论对北京语言大学汉语进修学院某次考试试卷进行分析,希冀为对外汉语教学提供一些有益的经验。实验结果表明：对“掌握者”和“未掌握者”来说,题目难度总体上可接受,大部分题目的区分性能良好,虽然有的题目略有“瑕疵”,但值得保留,以提高教学内容的测试覆盖面及测验信度。有7个题目过难或过易,几乎不具备区分性能,需要删除或修改。相似文献

9.

概化理论在英语阅读精确性研究中的应用 总被引：1，自引：0，他引：1

张敏强刘淑桢黎光明《教育测量与评价(理论版)》2010,(9):4-8

阅读理解是英语测试的主要题型之一,但其语篇与题目设置不当会对测验结果造成偏差。本文采用Monte Carlo模拟技术生成的阅读数据,使用概化理论对英语测验中阅读理解题型的语篇及题目量进行不同结构的设置调整,以概化指标衡量各阅读设置的精确性,从而为测验编制者提供最佳的阅读设置信息。结果表明：增加阅读中的语篇量或题目量都可以提高测量的精度;语篇量与题目量可相互补偿以提升测量的精度;而同时提升语篇量与题目量时,测量精度的提升最为明显。相似文献

10.

测量术语

《中国考试》2004,(1)

同质性一个测验所包含的各个题目得分的一致性。与测验题目的内容、形式无关。它在心理测量(或测验)上涉及两个问题:1)测验的内部一致性,即测验的项目(测题)之间的相关;2)测验的效度,即该测验所测量的是单一特质还是多个特质。如果测验各题目得分有正相关,则测验为同质的,正相相似文献

11.

成人教育考试的试题及其规范化

《成人教育》1991,(4)

<正> 在一次测验中,恰当的选择题目类型,能提高测验的信度和效度。不同的题目类型,其测试功效也不同,有的适合测量简单的学习结果,有的适合测量高层次的认知目标。因此,不能空泛地谈论什么题型优,什么题型劣。其实,各种题型在卷面上构成一个整体,相互补充。总的说,题目的类型不宜过多或过少。过多,变换不定,会给考生带来不良的心理影响;过少,难以完成测验的各种目标。原则上要根据测验的性质、内容及认知目标的要求确定题型。1.客观性试题客观性试题主要包括选择题、是非题、匹配题、填空题及简答题。其特点是,题目的正确答案是唯一的,答对给满分,否则给零分。评卷不存在“宽”或“严”,只要不错判,给分都是一样的。另外,客观性试题,按相似文献

12.

第二语言学习者专业背景对HSK阅读成绩影响的项目功能差异检验 总被引：1，自引：0，他引：1

黄春霞《考试研究》2011,(5):59-66

本文旨在考察HSK应试者的专业背景是否会对他们的阅读成绩产生影响。运用MH方法和SIBTEST方法对2009年HSK(初中等)考试阅读题目进行DIF筛查,把专业背景为自然科学的HSK考生设为目标组,专业背景为人文社会科学的HSK考生设为参照组。MH方法的结果是没有找到含有DIF的题目;SIBTEST方法的结果如下:第一轮DIF筛查检测到一个题目,第二轮DBF筛查检测到一组题目。这组题目有利于人文社会学科专业背景的被试。就检测DIF的方法而言,本研究认为SIBTEST方法更加敏感,DBF检验更加适合像阅读理解测验这样的一组或多组相互关联的题目。相似文献

13.

基于网络的自适应试题库系统的开发

陈汝明《现代企业教育》2002,(6):38-38

一、自适应试题库系统的理论依据: 一个良好的测试系统必须以明确的教育测量理论作为理论基础。自适应测验是以近年来在网络教育领域中兴起的项目反应理论(IRT item response theory)为基础,强调测验应该自动地适应被试者的具体情况,将试题的内容、数量、难度和知识分布等因素与被试者的情况综合统筹,以受测者的回答问题的情况,经题目特征函数的运算,推测受测者的能力。流行的经典测试理论(CTT classical test theoryr)是目前教学中最常见的测试手段,适合横向的常模参照测验,支持固定试题的测验方法。基于这两种理论,该系统以自适应测验为相似文献

14.

立足基础，提高综合素质（Ⅰ）

王勇《中国考试》2002,(10):9-41

近年高考“理科综合能力测试”更加注重对能力的考查。从题型到内容基本稳定，在稳定中又有变化，其变化的倾向，就是更加重视对考生综合素质的考查，题目更加开放，以利于考查考生发散性思维能力和运用所学知识分析和解决问题的能力。考试的题目越来越灵活，要求考生尽可能在理解的基础上牢固地掌握必要的基础知识、基本技能。要立足学好本学科内容的基础上，作到“知其然，知其所以然，举一反三”，并能适当联系实际。不仅知识要扎实、思维要活跃、分析问题要有深度和广度，特别要表现出自己的独创精神。相似文献

15.

阅读理解考试篇章数量与题目数量拟合度研究

《中国考试》2014,(5)

阅读篇章的选择、多项选择题目的设计以及篇章数量与测验题目数量的拟合度问题,是影响阅读理解能力测试信度和效度的基本因素。篇章数量和题目数量的不同组合方式对阅读理解测验误差和信度的影响也不相同。本研究以中国汉语水平考试(HSK)的实测数据为基础,随机选择500名考生作为研究样本,借助概化理论的随机双面嵌套(nested)设计s×(i:p)分析了HSK阅读理解测验中的误差来源和结构,对篇章数量和题目数量的匹配合理性进行了检验。研究结果显示:增加文章数量和题目数量均可以提高测验的精度,但增加文章数量比增加题目数量对概化系数(Generalizability coefficient,Eρ2)的提高作用更有效;HSK阅读理解测验的篇章数量和题目数量的现行组合方式符合误差控制的原则和信度指标的要求。相似文献

16.

英语测试中选择题型对学习者的负面影响及相关对策

黄河《培训与研究》2008,(12):112-114

我国大多英语测试题型结构以客观性试题的设置为主,其中选择—反应测验题目占据了最大比例。然而由于以选择—反应测试题目为主的英语考试对学生学习成就测量的准确性不足,这种英语测试题对学生的学习动机、学习方法、学习效果等有较大负面影响,因此英语测试题目设置应当进行针对性的进行改革。相似文献

17.

香港学科能力评估将取代学能测验获教育界欢迎

克农《世界教育信息》1998,(7)

将在2000年推行长期以来遭受教育界和家长批评的小六“学能测验”将被取消,并被以学生学科内容为测验内容“学科能力评估”取代。据教育署辖下的教育委员会在《九年免费教育检讨报告》中建议,有关评估将在2000年始实行,并分为两部分评估内容,包括“语文能力评估”和“数学能力评估”。根据报告书建议,拟实行的学科能力评估测验旨在作为一种能力测验,测试小学生在完成六年小学课程后应该学会的较高层次的思考方法,包括应用、分析、综合、推理和解决问题的能力,有别于现时以文字推理和数学推理两份试卷来测验学生简单推理能力的做法,而测试项目将取自小学的各科课程纲要。相似文献

18.

高等教育自学考试试卷平行性及其评价维度初探 总被引：1，自引：1，他引：0

赵海燕王桥影赵晓茫《中国考试》2010,(2)

高等教育自学考试是一种典型的标准参照测验。试卷的平行性可以界定为相同专业下同一课程的不同试卷在形式、内容、功能和分数结果上的一致性和可比性,它对自学考试的科学性和有效性具有非常重要的意义。对自学考试试卷平行性的度量和控制,可以从试卷结构、题目内容、题目功能和结果数据四个方面进行。相似文献

19.

英语测试中选择题型对学习者的负面影响及相关对象

黄河《培训与研究》2008,25(12)

我国大多英语测试题型结构以客观性试题的设置为主,其中选择一反应测验题目占据了最大比例.然而由于以选择一反应测试题目为主的英语考试对学生学习成就测量的准确性不足,这种英语测试题对学生的学习动机、学习方法、学习效果等有较大负面影响,因此英语测试题目设置应当进行针对性的进行改革. 相似文献

20.

一次初二物理测验的改进

李继芳《物理教师》1988,(4)

如何检查一单元的教学效果,通常采用测验办法,即在一定时间内让学生完成所要检查的题目。这种严谨、肃穆的场面往往会使一些学生的精神过度紧张而在某种程度上抑制思维能力的正确发挥,导致测验效果不佳。为此,我们对测验作一次改革尝试,即在实验室里利用投影器以投映幻灯片内容为主线,进行测验。结果发现,幕布上的“景”和题目中的“情”很容易激发学生的答题情绪和开阔他们的思路。现介绍具体做法。一、投映“液压机构造示意图”(用黑相似文献