期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
被试作答失误现象及稳健性估计方法的测验模拟分析
1
作者 简小珠 戴步云 《考试研究》 2025年第1期46-54,共9页
在测验中被试往往由于各种原因会出现作答失误现象,以往研究者已提出用睡眠现象、失误现象两个测量概念来描述被试作答失误现象。本文提出测验中失误现象的新测量模型,针对睡眠现象、失误现象的测量模型,分为存在或不存在失误现象(睡眠... 在测验中被试往往由于各种原因会出现作答失误现象,以往研究者已提出用睡眠现象、失误现象两个测量概念来描述被试作答失误现象。本文提出测验中失误现象的新测量模型,针对睡眠现象、失误现象的测量模型,分为存在或不存在失误现象(睡眠现象)两类情境分别进行模拟,并使用多种稳健性估计方法进行能力估计。由测验模拟结果可知,四参数Logistic模型稳健性估计方法在多种测验情境下都能够实现稳健性估计,有效纠正失误现象(睡眠现象)造成的能力低估问题。失误现象所描述的对象是全体被试,更能有效代表测验中的被试作答失误现象。 展开更多
关键词 睡眠现象 失误现象 四参数Logistic模型 稳健性估计
在线阅读 下载PDF
IRT中Logistic模型的c、γ参数对能力估计的改善 被引量:7
2
作者 简小珠 戴海崎 彭春妹 《心理学报》 CSSCI CSCD 北大核心 2007年第4期737-746,共10页
设计一个理想测验和被试作答情况,在单、双参数模型下进行能力估计,存在第一、二未契合现象;增加c参数后进行能力估计,则能有效纠正第一未契合现象,仍然存在第二未契合现象,同时存在第三未契合现象;增加γ参数后进行能力估计,则能有效... 设计一个理想测验和被试作答情况,在单、双参数模型下进行能力估计,存在第一、二未契合现象;增加c参数后进行能力估计,则能有效纠正第一未契合现象,仍然存在第二未契合现象,同时存在第三未契合现象;增加γ参数后进行能力估计,则能有效纠正第二未契合现象,仍然存在第一未契合现象,同时存在第四未契合现象;同时增加c、γ参数后进行能力估计,则能有效纠正第一、二、三、四未契合现象。最后概述了c、γ参数的测量含义。 展开更多
关键词 IRT LOGISTIC模型 能力条件估计 良好契合 未契合现象.
在线阅读 下载PDF
四参数模型对被试作答异常现象的拟合与纠正 被引量:8
3
作者 简小珠 焦璨 +1 位作者 Steven P.Reise 彭春妹 《心理科学进展》 CSSCI CSCD 北大核心 2010年第3期537-544,共8页
心理与教育测验中存在着被试作答异常现象(能力测验中的猜测现象和睡眠现象,人格测验中的非0下渐近线现象和非1上渐近线现象),会导致被试能力或人格特征的测量偏差。在能力测验中,研究者已提出了多种方法来纠正猜测现象和睡眠现象,这些... 心理与教育测验中存在着被试作答异常现象(能力测验中的猜测现象和睡眠现象,人格测验中的非0下渐近线现象和非1上渐近线现象),会导致被试能力或人格特征的测量偏差。在能力测验中,研究者已提出了多种方法来纠正猜测现象和睡眠现象,这些方法往往需要调整或删除被试作答信息,而四参数模型不需要改变被试作答信息而能有效纠正被试能力高估或低估现象。在人格测验中存在着非0下渐近线和非1上渐近线现象,四参数模型能增强测验项目拟合性能,提高人格测验的准确性。 展开更多
关键词 IRT 猜测现象 睡眠现象 四参数Logistic模型
在线阅读 下载PDF
CAT选题策略分类概述 被引量:4
4
作者 简小珠 戴海琦 +1 位作者 张敏强 彭春妹 《心理学探新》 CSSCI 2014年第5期446-451,共6页
选题是计算机化自适应测验(CAT)测试过程的关键环节,选题策略的目标是要达到较高的测量精度,同时也实现试题曝光率控制及其他测验目标的实现。本文根据选题策略的基本原理和衍生发展,将众多CAT选题策略分为五大选题策略系列:Fisher函数... 选题是计算机化自适应测验(CAT)测试过程的关键环节,选题策略的目标是要达到较高的测量精度,同时也实现试题曝光率控制及其他测验目标的实现。本文根据选题策略的基本原理和衍生发展,将众多CAT选题策略分为五大选题策略系列:Fisher函数系列、K-LI函数系列、α分层系列、贝叶斯系列、b匹配系列;并根据测验目标(测验精度、试题曝光率控制、内容平衡、多条件约束)对这些选题策略进行了细分,并对CAT选题策略的选择思路进行归纳。 展开更多
关键词 CAT 选题策略 Fisher函数 K-LI函数 α分层 贝叶斯选题策略 b匹配方法
在线阅读 下载PDF
四参数Logistic模型研究进展及其评析 被引量:8
5
作者 简小珠 张敏强 彭春妹 《心理学探新》 CSSCI 2010年第3期69-73,共5页
在测验中存在着低能力被试答对高难度试题的猜测现象,和高能力被试答错容易试题的睡眠现象,此时可以使用四参数模型来分析测验数据。Barton和Lord认为应用四参数模型的实践意义不大,但结论的依据不充分。近年来研究者从测验项目拟合,改... 在测验中存在着低能力被试答对高难度试题的猜测现象,和高能力被试答错容易试题的睡眠现象,此时可以使用四参数模型来分析测验数据。Barton和Lord认为应用四参数模型的实践意义不大,但结论的依据不充分。近年来研究者从测验项目拟合,改善被试能力估计等方面进行了分析,认为在四参数模型下可以有效纠正被试能力高估或低估现象,认为单、两、三参数模型是四参数模型的特例,建议使用四参数模型。 展开更多
关键词 IRT 四参数模型 猜测现象 睡眠现象
在线阅读 下载PDF
4参数GRM对猜测现象和失误现象的纠正 被引量:4
6
作者 简小珠 戴海琦 《江西师范大学学报(自然科学版)》 CAS 北大核心 2016年第2期140-144,共5页
将c、γ参数加入到Samejima等级反应模型中形成4参数等级反应模型(4参数GRM),该模型包含了两级记分1、2、3、4参数Logistic模型、Samejima等级反应模型.4参数GRM适合测验中的多级和两级记分试题,也可以适合两级记分试题的猜测现象和失... 将c、γ参数加入到Samejima等级反应模型中形成4参数等级反应模型(4参数GRM),该模型包含了两级记分1、2、3、4参数Logistic模型、Samejima等级反应模型.4参数GRM适合测验中的多级和两级记分试题,也可以适合两级记分试题的猜测现象和失误现象.Samejima等级反应模型下,被试作答的猜测现象会导致能力高估现象,失误现象会导致能力低估现象.在4参数GRM下,被试能力高估现象和低估现象均得到了有效的纠正. 展开更多
关键词 项目反应理论 等级反应模型 4参数等级反应模型 猜测现象 失误现象
在线阅读 下载PDF
基础教育学业水平监测题库建设的整体规划 被引量:8
7
作者 简小珠 金锐 张敏强 《考试研究》 2011年第1期53-58,共6页
题库依据考试种类不同有选拔、评定、监测、考查、辅导等几种功能。基础教育学业水平监测的题库应定位在学业监测上,并兼有教育辅导功能。本文具体论述了学业水平监测题库建设的重要步骤与环节,包括题库测量理论的选择、题库的命题依据... 题库依据考试种类不同有选拔、评定、监测、考查、辅导等几种功能。基础教育学业水平监测的题库应定位在学业监测上,并兼有教育辅导功能。本文具体论述了学业水平监测题库建设的重要步骤与环节,包括题库测量理论的选择、题库的命题依据、题库建设的结构、学业水平等级的划分方法、题库建设的规划顺序等。笔者认为,基础教育学业水平监测的题库建设是一个系统工程,前期规划需要从题库的最终用途出发,以分析题库与考试的使用要求、目标为重点,从而为后期的题库建设制定严谨周密的规划方案。 展开更多
关键词 题库 学业水平监测 课程标准 教育辅导
在线阅读 下载PDF
Logistic加权模型的理论构建与模拟分析 被引量:2
8
作者 简小珠 戴步云 戴海琦 《心理学报》 CSSCI CSCD 北大核心 2016年第12期1625-1630,共6页
试题难度、试题考查重要性程度加权是多级记分试题的两个基本属性,因而在IRT项目特征函数中需用不同参数来表示。以往多级记分模型用多个难度参数来描述多级记分试题的难度,不能有效的表达多级记分试题的分数权重作用。从多级记分试题... 试题难度、试题考查重要性程度加权是多级记分试题的两个基本属性,因而在IRT项目特征函数中需用不同参数来表示。以往多级记分模型用多个难度参数来描述多级记分试题的难度,不能有效的表达多级记分试题的分数权重作用。从多级记分试题的分数加权作用角度,本文提出Logistic加权模型并论述了理论构建思想。在Logistic加权模型下对项目参数估计的EM算法进行推导并编写了相应的参数估计程序。在Logistic加权模型下进行测验模拟,发现项目参数估计的模拟返真性能良好。 展开更多
关键词 IRT LOGISTIC模型 Logistic加权模型 多级记分模型
在线阅读 下载PDF
CAT初始阶段被试能力估计方法改进探究 被引量:2
9
作者 简小珠 张敏强 《心理科学》 CSSCI CSCD 北大核心 2010年第6期1470-1472,共3页
在CAT初始阶段被试作答的信息较少,对被试能力进行合理和稳健的估计比较困难。本文设计CAT测试过程的代表性测验样例,使用不同能力估计方法比较CAT初始阶段的被试能力估计情况。在单参数模型下,在题量较少时,EAPE-N(0,0.5)方法的能力估... 在CAT初始阶段被试作答的信息较少,对被试能力进行合理和稳健的估计比较困难。本文设计CAT测试过程的代表性测验样例,使用不同能力估计方法比较CAT初始阶段的被试能力估计情况。在单参数模型下,在题量较少时,EAPE-N(0,0.5)方法的能力估计的合理性和稳健性要相对优于MLE、EAPE-N(0,2)、EAPE-N(0,1)方法。在CAT测试过程中可以先使用先验分布方差较小的EAPE方法进行估计,随着测试题量增加,逐步增大EAPE方法的先验分布方差,并可以和a分层选题策略结合起来使用。 展开更多
关键词 CAT 极大似然估计 期望后验估计 期望后验估计调整方法
在线阅读 下载PDF
“CAT初始作答影响最终成绩”的模拟分析与纠正 被引量:2
10
作者 简小珠 戴海琦 《心理学探新》 CSSCI 北大核心 2016年第3期276-280,共5页
在两参数模型(2PM)下模拟计算机化自适应测验(CAT)初始阶段的三种作答情境,由模拟结果发现只有当被试作答情境为睡眠现象时会导致能力低估现象,猜测现象时会导致能力高估现象,并探讨了"CAT初始阶段作答影响最终成绩"考试现象... 在两参数模型(2PM)下模拟计算机化自适应测验(CAT)初始阶段的三种作答情境,由模拟结果发现只有当被试作答情境为睡眠现象时会导致能力低估现象,猜测现象时会导致能力高估现象,并探讨了"CAT初始阶段作答影响最终成绩"考试现象发生的具体情境范围。由模拟结果分析可得,CAT考试现象是被试作答异常现象(猜测、睡眠现象)和CAT数学模型(2PM)共同影响的结果。在四参数模型(4PM)、2PM-Biweight下进行CAT模拟,被试能力高估现象和低估现象都得到了较好的纠正。 展开更多
关键词 CAT模拟 猜测现象 睡眠现象 能力高估 能力低估
在线阅读 下载PDF
计算机自适应测验的测试流程与测试技术 被引量:3
11
作者 简小珠 张敏强 彭春妹 《滁州职业技术学院学报》 2012年第1期58-63,共6页
计算机自适应测验是现代教育测验的一种新形式。计算机自适应测验的指导理论和测试思想与传统纸笔测验不同,而且测试方面有诸多的优点。本文详细论述计算机自适应测验的基本测试流程,包括被试即时能力估计、选题策略、曝光率控制、测验... 计算机自适应测验是现代教育测验的一种新形式。计算机自适应测验的指导理论和测试思想与传统纸笔测验不同,而且测试方面有诸多的优点。本文详细论述计算机自适应测验的基本测试流程,包括被试即时能力估计、选题策略、曝光率控制、测验终止标准等八个基本步骤;并进一步论述了计算机自适应测验在实测中应解决的关键技术与问题:在线参数估计、试题与测验交叠率控制、纸笔测验与计算机等值、多维评价与认知诊断等。 展开更多
关键词 项目反应理论 计算机自适应测验 测试流程
在线阅读 下载PDF
教育与心理统计分析中效果量计算的案例应用 被引量:2
12
作者 简小珠 戴步云 肖丽娟 《教育测量与评价》 2017年第8期16-19,15,共5页
目前教育与心理的实验研究和调查分析在使用均值比较分析、方差分析、列联表卡方分析时,通常需要报告效果量、统计检验力等指标,本文通过案例应用的角度来介绍效果量计算的辅助软件操作。在该计算辅助软件中,需要先在SPSS软件中进行初... 目前教育与心理的实验研究和调查分析在使用均值比较分析、方差分析、列联表卡方分析时,通常需要报告效果量、统计检验力等指标,本文通过案例应用的角度来介绍效果量计算的辅助软件操作。在该计算辅助软件中,需要先在SPSS软件中进行初步的统计分析,将初步统计结果制作为Excel文件,然后再导入到计算辅助软件,在软件中只需要依步骤就能计算出效果量和检验力,并给出效果量的统计分析与建议。 展开更多
关键词 效果量 统计检验力 假设检验
在线阅读 下载PDF
计算机化自适应测验模拟方法的研究范式与特点 被引量:1
13
作者 简小珠 戴步云 陈平 《中国考试》 2016年第1期16-22,共7页
计算机化自适应测验(CAT)在理论与实践中得到广泛应用。目前许多CAT研究可以归纳为两种研究范式:实测作答的CAT研究范式和测验作答数据模拟的CAT研究范式。CAT模拟研究方法的步骤有模型选择、题库模拟、测试起点、选题策略、测验终止策... 计算机化自适应测验(CAT)在理论与实践中得到广泛应用。目前许多CAT研究可以归纳为两种研究范式:实测作答的CAT研究范式和测验作答数据模拟的CAT研究范式。CAT模拟研究方法的步骤有模型选择、题库模拟、测试起点、选题策略、测验终止策略等。CAT模拟研究的主要趋势有:选题策略、终止策略仍然是CAT研究的重点;CAT模拟研究的设计内容更适合实际测验情况;CAT研究设计采取多因素设计;模拟结果多方面综合评价等。 展开更多
关键词 项目反应理论 计算机化自适应测验 CAT模拟
在线阅读 下载PDF
计算机自适应测验的测试流程与测试技术 被引量:4
14
作者 简小珠 张敏强 彭春妹 《教育测量与评价(理论版)》 2011年第12期9-14,共6页
计算机自适应测验是现代教育测验的一种新形式。计算机自适应测验的指导理论与传统纸笔测验不同,而且测试方面有诸多的优点。本文详细介绍计算机自适应测验的基本测试流程,包括被试即时能力估计、选题策略、曝光率控制、测验终止标准等... 计算机自适应测验是现代教育测验的一种新形式。计算机自适应测验的指导理论与传统纸笔测验不同,而且测试方面有诸多的优点。本文详细介绍计算机自适应测验的基本测试流程,包括被试即时能力估计、选题策略、曝光率控制、测验终止标准等八个基本步骤;并进一步论述了计算机自适应测验在实测中应解决的关键技术与问题:在线参数估计、试题与测验交叠率控制、纸笔测验与计算机等值、多维评价与认知诊断等。 展开更多
关键词 项目反应理论 计算机自适应测验 测试流程 测试技术
在线阅读 下载PDF
IRT下猜测现象和失误现象的原因阐释与数学推导
15
作者 简小珠 张敏强 《考试研究》 2015年第4期56-60,共5页
在测验中存在着被试在相对高难度试题上得分的猜测现象,也存在着被试在较容易试题上失分的失误现象。本文详细分析导致猜测现象和失误现象的各种可能原因。从数学公式推导的角度论证可得:在一定测验情境下,被试答对试题难度越大,获得前... 在测验中存在着被试在相对高难度试题上得分的猜测现象,也存在着被试在较容易试题上失分的失误现象。本文详细分析导致猜测现象和失误现象的各种可能原因。从数学公式推导的角度论证可得:在一定测验情境下,被试答对试题难度越大,获得前进的能力步长越大,被试能力被相对高估;被试答错试题难度越小,"被惩罚"后退的能力步长绝对值越大,被试能力被相对低估。 展开更多
关键词 猜测现象 失误现象 能力高估 能力低估
在线阅读 下载PDF
基于IRT的计算机化适应性测验的概念、类型及特征
16
作者 简小珠 张敏强 《中国考试》 CSSCI 北大核心 2024年第9期66-75,共10页
近年来,适应测验实践的需要,计算机化适应性测验(CAT)呈现多类型、多方向的发展态势。本文在总结梳理国内外相关文献基础上,讨论了基于项目反应理论(IRT)的CAT概念内涵,指出CAT的关键特征是试题难度参数与被试能力参数建立在同一量尺上... 近年来,适应测验实践的需要,计算机化适应性测验(CAT)呈现多类型、多方向的发展态势。本文在总结梳理国内外相关文献基础上,讨论了基于项目反应理论(IRT)的CAT概念内涵,指出CAT的关键特征是试题难度参数与被试能力参数建立在同一量尺上;并依据概念内涵,将目前CAT多样化测验形式归纳为三个大类,包括基于IRT的认知诊断计算机化适应性测验、计算机化多阶段适应性测验、计算机化分类测验。CAT测验的三大类型各有其测量技术特点与实践应用优势,均具有良好的发展前景。 展开更多
关键词 计算机化适应性测验 认知诊断计算机化适应性测验 计算机化多阶段适应性测验 计算机化分类测验
在线阅读 下载PDF
计算机自适应测验中测验安全控制方法评述 被引量:11
17
作者 李铭勇 张敏强 简小珠 《心理科学进展》 CSSCI CSCD 北大核心 2010年第8期1339-1348,共10页
计算机自适应测验在实际应用中曾经受到了测验安全问题质疑。国内外学者主要从两种研究思路提出了测验安全控制的方法:一是控制项目的最大曝光率,沿着这个思路发展出来的方法有SH法、项目合格方法、多重最大曝光率法等;二是改进选题策略... 计算机自适应测验在实际应用中曾经受到了测验安全问题质疑。国内外学者主要从两种研究思路提出了测验安全控制的方法:一是控制项目的最大曝光率,沿着这个思路发展出来的方法有SH法、项目合格方法、多重最大曝光率法等;二是改进选题策略,沿着这个思路发展的方法主要是a分层法及其变式。此外,近年来出现了测验安全控制方法之间相结合的研究思路。本文从均方误差、项目曝光率、题库利用率等指标论述了测验安全控制方法的优缺点,并概述了这些测验安全控制方法的研究发展历程与发展思路,展望了今后的研究趋势。 展开更多
关键词 测验安全 SH法 项目合格方法 多重最大曝光率法 a分层法
在线阅读 下载PDF
多水平IRT的发展与应用述评 被引量:8
18
作者 刘慧 简小珠 +1 位作者 张敏强 熊悦欣 《心理科学进展》 CSSCI CSCD 北大核心 2012年第4期627-632,共6页
阶层线性模型是处理阶层结构数据的高级统计方法,项目反应理论是精确测量被试能力的现代测量理论。多水平项目反应理论将阶层线性模型和项目反应理论相结合,将项目反应模型嵌套在阶层线性模型内,实现了项目参数和不同水平能力参数的估计... 阶层线性模型是处理阶层结构数据的高级统计方法,项目反应理论是精确测量被试能力的现代测量理论。多水平项目反应理论将阶层线性模型和项目反应理论相结合,将项目反应模型嵌套在阶层线性模型内,实现了项目参数和不同水平能力参数的估计,对回归系数和误差项变异的估计也更加精确。作者概述了多水平项目反应理论的发展历程,并从项目功能差异、测验等值、学校效能研究等方面评述了多水平项目反应理论在心理与教育测量中的应用,总结了多水平项目反应理论的价值,同时展望了今后的研究趋势。 展开更多
关键词 多水平项目反应理论 项目反应理论 阶层线性模型
在线阅读 下载PDF
规则空间模型在瑞文智力测验中的认知诊断分析 被引量:7
19
作者 张敏强 简小珠 陈秋梅 《心理科学》 CSSCI CSCD 北大核心 2011年第2期266-271,共6页
规则空间模型是一种基于统计模式识别和分类的认知诊断方法,此方法可以根据被试的作答反应,分析诊断被试的认知属性掌握情况。以往智力测验只是报告测验分数,对被试能力解释较为简单,缺乏必要的认知诊断分析。本文根据瑞文标准推理测验... 规则空间模型是一种基于统计模式识别和分类的认知诊断方法,此方法可以根据被试的作答反应,分析诊断被试的认知属性掌握情况。以往智力测验只是报告测验分数,对被试能力解释较为简单,缺乏必要的认知诊断分析。本文根据瑞文标准推理测验的难度层级特点,分析其所包含属性及其连接关系,并运用规则空间模型将所有被试划分在48种典型反应模式中,而且大部分被试都会集在几个典型反应模式中。本文对这些典型反应模式进一步分析被试的认知状态,并为教育辅导与人员选拔安排提供建议。 展开更多
关键词 规则空间模型 认知诊断 认知属性 瑞文标准推理测验
在线阅读 下载PDF
被试作答的偶然性对IRT能力估计的影响研究 被引量:6
20
作者 戴海崎 简小珠 《心理科学》 CSSCI CSCD 北大核心 2005年第6期1433-1436,共4页
被试能力参数估计是项目反应理论应用研究最重要的技术之一。本文在理想的测验情境下,研究被试作答的偶然性对被试能力值估计的影响。研究设计了被试作答的两种偶然性情况:一是偶然做对了一道项目难度高于其能力值的试题,二是偶然做错... 被试能力参数估计是项目反应理论应用研究最重要的技术之一。本文在理想的测验情境下,研究被试作答的偶然性对被试能力值估计的影响。研究设计了被试作答的两种偶然性情况:一是偶然做对了一道项目难度高于其能力值的试题,二是偶然做错了一道或几道项目难度低于其能力值的试题,然后分别探讨了这两种情况下对被试的能力估计所带来的影响,并且就如何消除这些偶然性所带来的影响提出了相应的方法。 展开更多
关键词 IRT 能力参数估计 作答的偶然性 四参数logistic模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部