首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
计算机自适应测验(Computerized Adaptive Testing,简称CAT)是用项目反应理论建立题库,并由计算机根据被试能力水平自动选择测题,最终对被试能力作出估计的一种新型测验,其目的在于通过被试正确回答题目难度的高低来评价其能力。  相似文献   

2.
计算机自适应测验(CAT)是建立在项目反应理论基础上,由计算机根据被试能力水平自动选择测题,从而对被试能力做出估计的新型测验。计算机自适应测验呈现给考生的试题是依据被试在前一个试题作答的表现好坏来决定的,其实现条件应囊括以下五个部分。  相似文献   

3.
教师自编测验是指教师根据教学过程不同阶段的不同任务,确定测验的不同目的,编制不同的测验。如合格测验(目标参照测验)需要有较高的内容效度;用于选拔的择优测验就需要测验项目有合理的难度分布,使测验具有鉴别力;难度测验的目的在于考核学生所掌握的知识、技能在一定范围内所能达到的水平。此外,还有难度不大但项目很多且限制答卷时间的速度测验等。  相似文献   

4.
本文旨在研究大学英语四级考试集库式完形填空的内容效度,即探索它是否能测量被试在篇章层次上理解和运用单词的能力。被试为上海某高校438名非英语专业学生,研究工具为四个测验。其中两篇测验(整A和整B)取自大学英语四级考试历年真题。另外两篇测验(散A和散B),分别改编自整A和整B。随机抽取的高低两个水平的被试,分别完成了一个整篇原文测验和一个散句改编测验。结果显示,在整篇原文和散句改编测验中,高水平被试的成绩并没有体现显著差异;低水平被试整篇和散句测验成绩有显著差异。研究表明,可通过提高考点层次、适当增加选项的干扰性来提高大学英语四级集库式完形填空的内容效度。  相似文献   

5.
在测验中存在着被试在相对高难度试题上得分的猜测现象,也存在着被试在较容易试题上失分的失误现象。本文详细分析导致猜测现象和失误现象的各种可能原因。从数学公式推导的角度论证可得:在一定测验情境下,被试答对试题难度越大,获得前进的能力步长越大,被试能力被相对高估;被试答错试题难度越小,"被惩罚"后退的能力步长绝对值越大,被试能力被相对低估。  相似文献   

6.
复本信度     
复本信度也叫等值系数,是衡量测验不同版本的等值程度的指标.用同一测验的两个版本(A、B)对同一组被试实测后,计算两个版本得分的相关系数,复本信度系数高,表示被试不论用A版本,还是用B版本,实测分数基本相同,A版本和B版本可以相互替代;复本信度系数低,则表示被试做A版本和做B版本,实测分数不一样,这两种版本的测验不能相互替代.  相似文献   

7.
在课堂教学中,学生获得有效知识量的多少与课堂学习效率问题有关.我国的高中生对于内在认知负荷低的学习材料的学习,原有知识水平低且工作记忆广度小的被试和原有知识水平高且工作记忆广度大的被试的得分没有显著性差异:对于内在认知负荷高的学习材料的学习,两组被试的得分存在非常显著的差异;教学方法和组别在低负荷材料学习上的得分的交互作用处于边缘水平,而在高负荷材料学习上的得分的交互作用非常显著.  相似文献   

8.
通过对经典测量理论与项目反应理论在基本假设、测验精度计量、测验的标准误以及测验项目的筛选等四个主要领域的比较,可以发现项目反应理论具有被试能力估计的项目选择独立性、项目难度参数与能力参数的刻度统一性、项目参数估计的样本独立性、估计测量误差的精确性等几个优点;但是在某些模型中存在单维性假设难以满足、测验条件要求严格以及数学模型简约性差等需要解决的问题。  相似文献   

9.
采用瑞文标准推理测验,测查了四川省阿坝州和都江堰市的480名6岁、9岁、12岁藏族和汉族儿童.发现:(1)藏汉被试儿童SPM测验的得分不存在显著性差异;(2)两族被试儿童6岁组和9岁组中并未出现显著性差异,在12岁组的比较中发现两族被试儿童的测验得分差异显著;(3)两族男女测验得分的平均分并不存在显著性差异.结果表明,5.12地震灾区藏汉儿童的智力测验成绩在总体上差异不显著,也未发现性别差异.但在一定的年龄阶段,被试儿童的智力测验成绩具有显著差异.  相似文献   

10.
采用自编问卷对全国各地区18岁及以上的不同群体进行心理健康状况调查,结果表明:(1)总体上,当前我国人们心理健康处于较高的内、外部和谐状态;(2)在人与内、外部世界和谐以及心理健康水平上,体力型比脑力型和兼有型低,兼有型又比脑力型低;(3)在人与内部世界和谐上,成年初期比成年中期低;在人与外部世界和谐上,成年初期比成年中期和晚期低;(4)在人与自身、人与自然、人与社会维度以及心理健康总分上,城市被试比农村、乡镇被试高,乡镇被试比农村高;在人与信仰维度上,城市被试得分比农村、城镇被试高,农村与城镇被试间无显著差异;(5)大学及以上教育程度的被试较中学及以下教育程度的被试在各个因子上得分都高,心理健康水平亦高。  相似文献   

11.
使用症状自评量表(SCL-90)和树木人格投射测验对四川省某中学高二年级74名学生实施测量,进行配对样本t检验和相关分析。从树木画分析来看,学生整体表现出心理健康状况欠佳的现状;从SCL-90测试结果来看,学生焦虑、精神病性和强迫症状得分显著高于常模;树木画得分与SCL-90总分呈显著负相关。结果显示:被试学生心理健康水平欠佳,具有高焦虑、高强迫、高精神性的人格特征;树木—人格投射测验在中小学生心理健康评估中有较高的应用价值。  相似文献   

12.
为了探索公正信念驱动下大学生的内隐和外显利他特征,以大学生为被试,分别采用公正世界信念量表和利他倾向量表测量大学生的公正世界信念和外显利他倾向,同时使用内隐联想测验测量被试的内隐利他倾向.结果表明:无论公正世界信念的高低,大学生都具有内隐利他倾向;高、低公正世界信念大学生在内隐利他反应时上的差异不具有显著性,且大学生公正世界信念与内隐利他倾向之间的相关不显著;高、低公正世界信念大学生在外显利他倾向的得分差异具有显著性,且公正世界信念和外显利他倾向之间的相关达到显著性水平.  相似文献   

13.
通过概念图评估和测验,探讨八年级学生建构概念图的特征,能够很好的反映出学生的学业水平。相比被试概念图制作的概念得分和层级得分,命题得分对学生的科学学业测验成绩有更高的预测效度。通过对学生制作的概念图错误问题的分析,能够反映学生在学习过程中存在的问题,并能有效地指导教师的教学。  相似文献   

14.
共同被试法是通过相同被试寻找不同测验形式之间等值关系的方法,适用于大规模测验的等值转换。当两个实际被试组能力分布差异较大或能力分布未知的情况下,可采用同一组被试,让他们参加两种测验形式的测验。然后通过比较这一组被试在两种测验上的分数,得出测验等值关系。  相似文献   

15.
采用儿童心理综合量表,对桂林市144名6~9岁儿童进行社会生活能力测验,发现:被试社会生活能力的发展总体状况是良好的。但随着年龄的增长,“社会生活技术低于实际年龄应当达到水平”的情况有所加重。儿童社会生活技术水平没有学校间的差异,但儿童社会生活技术水平存在着父亲文化程度上的差异:父亲文化程度低的儿童,其社会生活技术水平显著高于父亲文化程度高的儿童  相似文献   

16.
计算机自适应测验在网络课程建设中的应用研究   总被引:1,自引:0,他引:1  
计算机自适应测验(CAT)根据每个被试的水平,对不同的被试实施不同的测验项目,与传统纸笔测验相比,有很多优势。针对当前网络化学习中存在的问题,在现有CAT应用的基础上,尝试在网络课程建设中创新应用,发挥其及时反馈、自我激励、分层管理、认知诊断和学业评定的功能,提高网络化学习的质量。  相似文献   

17.
为了探讨元认知能力对超文本阅读的影响,本实验通过元认知问卷,筛选出高元认知能力组和低元认知能力组试组进行英语线性文本和超文本阅读,主要结果如下:元认知能力较高组与元认知能力较低组在线性文本的阅读中成绩差异不显著;具有良好元认知能力的被试,在超文本阅读中的得分明显高于元认知能力相对较差的被试,两者之间差异显著。  相似文献   

18.
本研究考察了点探测注意训练对考试焦虑的干预效果。首先使用考试焦虑量表(TAS)在小学、中学和大学分别筛选60、38、60名被试,依据TAS得分将其分别划为高考试焦虑实验组、高考试焦虑控制组和低考试焦虑控制组;在三周内采用点探测注意训练对三组被试进行13次、总时长65min的干预。高考试焦虑实验组和低考试焦虑控制组的训练程序中,探测刺激出现在先前呈现考试无关图片位置的概率为98%,而高考试焦虑控制组的训练程序中,探测刺激出现在先前呈现考试无关图片和考试相关图片位置的概率均为50%。干预结束后比较三组被试各自干预前后TAS得分差异。结果发现,小学、中学和大学实验组被试TAS得分前后测差值均显著大于控制组。研究表明,点探测注意训练能有效降低小学、中学和大学高考试焦虑个体的考试焦虑水平,干预效果良好。  相似文献   

19.
采取随机抽样的方法,从建瓯市第一小学四到六年级,第二中学初一至初三年级,高一至高三抽取616名学生作为被试,采用《心理健康诊断测验》(MHT)进行实测。研究显示:被试总体上心理健康状况良好;整体上男生的心理健康水平优于女生;各个学段心理健康状况有所差异,小学阶段各年级差异不大明显,中学阶段的起始年级心理健康状况最好;心理健康测试得分与学业成绩成绩呈显著负相关,心理健康诊断测验分数越低,即心理健康状况越好,则学业成绩也越好。  相似文献   

20.
计算机自适应测验依据被试作答的反应自动选择测验项目,是项目反应理论与计算机技术相结合的一种考试组织形式。随着计算机自适应测验的使用越来越广,特别是在大型考试的实施过程中,服务器的处理能力成为制约考试规模的重要因素之一。分布式计算可以有效提高系统的载荷,为网络服务提供更快的响应速度。贵州师范大学CAT实验室开发的计算机自适应测验系统PowerCAT,运用分布式计算的方式,为大规模考试提供了可用的负载能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号