项目反应理论
项目反应理论的相关文献在1986年到2022年内共计667篇,主要集中在教育、自动化技术、计算机技术、心理学
等领域,其中期刊论文627篇、会议论文32篇、专利文献180858篇;相关期刊348种,包括心理学探新、江西师范大学学报(哲学社会科学版)、现代教育技术等;
相关会议23种,包括2014亚洲华人生存质量学术交流会、第十届全国高等师范院校生物学课程与教学论学术论坛、2013年JMS第十届中国营销科学学术年会暨博士生论坛等;项目反应理论的相关文献由1177位作者贡献,包括丁树良、余嘉元、张敏强等。
项目反应理论—发文量
专利文献>
论文:180858篇
占比:99.64%
总计:181517篇
项目反应理论
-研究学者
- 丁树良
- 余嘉元
- 张敏强
- 涂冬波
- 漆书青
- 戴海琦
- 赵守盈
- 汪存友
- 简小珠
- 范晓玲
- 辛涛
- 付志慧
- 杨业兵
- 苗丹民
- 何壮
- 吴锐
- 戴海崎
- 曹亦薇
- 甘登文
- 程艳
- 罗照盛
- 蔡艳
- 陈平
- 黎光明
- 万崇华
- 孙晓敏
- 张青华
- 秦春影
- 肖玮
- 许维胜
- 郝元涛
- 郭庆科
- 陆宏
- 黄晓婷
- 何立新
- 刘炳伦
- 卢谢峰
- 史平
- 周骏
- 咸鹤群
- 喻晓锋
- 孙步宽
- 岳延兵
- 康平
- 康春花
- 张厚粲
- 方积乾
- 李伟明
- 李志军
- 李蕊
-
-
孙昕霙;
朱小柔;
巩俐彤
-
-
摘要:
目的本研究旨在评价糖尿病功能性健康素养量表。方法采用按规模大小成比例的概率抽样方法抽取北京市大兴区5‰的常住人口即7019人进行糖尿病功能性健康素养量表的评价,评价方法为项目反应理论。结果自行编制的糖尿病功能性健康素养量表经项目反应理论验证,各条目区分度在1.201~3.375范围内,难度在-3.081~0.576范围内,信息函数峰值在0.387~2.837范围内,即难易度、区分度、效度均达到可接受水平。最终量表共含30个条目,量表赋分方式为每题1分,共30分。与改编简版《中国公民健康素养调查问卷》相校验,组内相关系数为0.550(P<0.001),Pearson相关系数r=0.620,P<0.001,两量表得分显著正相关。ROC曲线下面积(AUC)为0.803,灵敏度为72.3%,特异度为74.0%。本量表得分≥20分判定为具备糖尿病功能性健康素养。结论本研究研制的糖尿病功能性健康素养量表能较好地测量糖尿病人群的健康素养。
-
-
郑云清
-
-
摘要:
大家知道,义务教育质量监测是体检仪也是解码器,它运用项目反应理论、矩阵抽样技术、认知诊断技术、回归分析技术等科学方法来对教育质量进行体检和解码。因此,我想从福建省义务教育质量监测相关统计数据来分析小初衔接问题,试图寻找到小初科学衔接的思考点与突破口,从而更好地促进义务教育阶段"双减"政策落地。
-
-
黄洁铭;
刘步平;
邝洁宜;
朱睿;
陈韵冰;
欧舒尹
-
-
摘要:
目的探讨维克森林医生信任量表(CWFPTS)中文版的项目功能差异。方法调查广州某三甲医院门诊患者387人,通过主成分分析判断单维性,运用双参数Logistic等级回归进行CWFPTS条目性别、受教育程度的项目功能差异(DIF)分析。结果总方差解释率53.59%,Cronbach’sα为0.82~0.86,条目分离指数0.65~0.66;条目2、3、9在年龄和受教育程度均出现DIF,条目4在年龄出现DIF,条目5在受教育程度出现DIF。结论CWFPTS内部一致性较好,部分条目仍有修改空间。
-
-
沈励;
万雅奇
-
-
摘要:
为考试机构的考试数据分析工作提供实践新思路,以某学科高中学业水平等级考适应性测试数据为样本,采用CTT下的亚组分析及试题难度参数结构分析、多级计分IRT下的试题类别特征曲线和信息函数,分析试卷对不同能力考生的区分程度、试题难度结构配比、非选择题分值及采分点设置的适宜性。研究表明,上述结合CTT和IRT的考试数据分析方法拓展了传统的考试数据分析模型,研究展现的数据分析流程、结果样式及用途说明能为等级考命题提供数据支持。
-
-
付志慧;
周末
-
-
摘要:
通过蒙特卡罗(Monte Carlo,MC)方法研究了三参数Logistic(three-parameter Logistic,3PL)模型的Gibbs抽样方法的估计效果。首先,介绍了3PL模型的定义和参数的先验分布;其次,介绍了潜变量的引进及Gibbs抽样过程;最后,进行了模拟实验,考虑了不同的测试长度n=10,20和40,不同的样本容量N=1000,2000和5000,以及项目参数取不同的先验假设下的实验情况。对于结果的评价指标为均方根误差(root mean squared error,RMSE)和偏差(bias)。实验结果表明,随着测试长度或样本容量的增大,RMSE逐渐减小,当项目参数的先验分布方差取值较小时,获得的RMSE比较小。因此,对于3PL模型,当样本容量不是很大或者是测试长度不够长时,项目参数采用方差较小的先验分布可以得到比较准确的估计结果。
-
-
曹艳琴;
姚兆宏
-
-
摘要:
为开发支持有效英语学习的现代辅助学习形式或工具提出了一种基于IRT和词汇学习记忆周期的个性化移动英语词汇学习系统,系统包括远程管理服务器、客户端移动学习系统和数据同步智能体等3部分。该系统基于个体的词汇能力和学习记忆周期,根据每个单词的难度和个体学习者的词汇能力,自适应地为个体学习者安排词汇学习。通过仿真分析,所提出的系统能够有效提高英语学习成绩。仿真还验证了系统的有效性及实用性。
-
-
-
-
摘要:
按照R.J.Mislevy(1993)的观点,心理与教育测量理论发展至今,大约经历了2个阶段:第一阶段为标准测验理论阶段(standard test theory),包括经典测量理论(classical testing theory,CTT)、项目反应理论(item response theory,IRT)和概化理论(generalizability theory,GT);第二阶段是以认知诊断(cognitive diag‐nosis)为核心内容的新一代测验理论。
-
-
李建生;
谢洋;
王佳佳;
冯贞贞
-
-
摘要:
背景基于经典测量理论研制的病证结合慢性阻塞性肺疾病患者疗效满意度问卷(ESQ-COPD)尚存在局限性,而联合应用经典测量理论和项目反应理论可实现优势互补,为研制/修订测评工具提供理论基础与方法学支撑。目的研制病证结合ESQ-COPD修订版(mESQ-COPD),并进行测量学特性评价。方法通过成立ESQ-慢性阻塞性肺疾病(COPD)修订小组、预设问卷基本特征、规范基本概念和术语、修订概念框架、建立条目池和评阅条目等环节,形成mESQ-COPD草表;2017年10月至2018年2月,采用方便抽样法选取全国10家三级甲等医院呼吸科门诊收治的COPD稳定期患者265例进行预调查,联合应用经典测量理论和项目反应理论分析与筛选条目,形成mESQ-COPD;2018年11月至2019年2月,采用方便抽样法选取全国6家三级甲等医院呼吸科门诊收治的COPD稳定期患者365例进行现场调查,评价mESQ-COPD测量学特性。结果最终形成的mESQ-COPD包括4个领域(临床症状、工作生活能力、环境适应能力和治疗效果)、19个条目。mESQ-COPD的Cronbach'sα系数为0.949,临床症状、工作生活能力、环境适应能力和治疗效果4个领域的Cronbach'sα系数分别为0.943、0.869、0.829、0.767;条目与所在领域相关系数分别为0.667~0.798、0.855~0.882、0.795~0.907、0.857~0.934;验证性因子分析结果显示,比较拟合指数、增量拟合指数均为0.94、非规范拟合指数为0.93,标准化残差均方根为0.07,近似误差均方根为0.16;mESQ-COPD及各领域与COPD评估测试的相关系数为0.371~0.538,与改良版医学研究委员会呼吸困难量表(mMRC)的相关系数为0.329~0.564;肺功能1、2级与肺功能3、4级患者mESQ-COPD及各领域得分比较,差异有统计学意义(P<0.01);问卷接受率为99.5%,完成率为99.2%,平均完成时间为(6.13±4.59)min。结论mESQ-COPD由19个条目组成,包括临床症状、工作生活能力、环境适应能力和治疗效果4个领域,具有良好的信度、效度和临床可行性,为COPD疗效评价提供了有效工具。
-
-
李付鹏;
宋吉祥
-
-
摘要:
在测验开发中,以具有局部依赖性的题组形式存在的试题越来越多。双因子模型(bi⁃factormodel)和两层模型(two-tiermodel)是近年来基于试题局部依赖性提出的2种多维度模型。对2种模型进行模拟比较,结果显示:2种模型均可以处理具有局部依赖的试题多维度问题,并在局部依赖的识别、试题参数估计、被试特质分数估计方面具有一致性;在数据与模型的拟合方面,两层模型具有更好的拟合性;在运算的效率方面,两层模型的时间复杂性更高;在数据模拟的稳健性方面,两层模型在测验维度较高时可能存在无法收敛问题,双因子模型更加稳健。建议在测验结构相对简单时使用双因子模型,在测验结构较为复杂时使用两层模型。
-
-
陈颖;
侯晓辉;
宁艳;
王晓妍;
李英华;
聂雪琼;
李杰;
田向阳;
王素芳
-
-
摘要:
目的 分析“中国公众公共卫生安全素养自制量表”的项目功能差异(DIF),检验量表题项质量,为开发公共卫生安全素养(PHSL)调查工具提供依据。方法 通过经典测试理论和项目反应理论相结合的方法编制了单维的中国公众公共卫生安全素养量表。使用自制的初始量表(30个题项),于2021年4—6月随机抽取湖北、广东、北京和四川省的2809名常住居民进行调查。利用SPSS 23.0进行PHSL得分分析,两组间比较采用t检验,多组间比较采用单因素方差分析。利用R4.1.2软件mirt和scDIF test包对量表题项进行不同人口学特征的DIF检验。结果 调查对象PHSL的平均得分为(34.44±7.59)(满分44分)。不同性别、年龄、文化程度、职业、地区、城乡、家庭年均总收入的公众PHSL得分差异均有统计学意义(P0.05);8个题项存在年龄的DIF(P<0.05);8个题项存在文化程度的DIF(P<0.05);6个题项存在职业的DIF(P<0.05);4个题项存在地区的DIF(P<0.05)。结论 中国公众公共卫生安全素养自制量表题项稳定性较好,适合推广使用。
-
-
邰隽;
Tai Jun;
Xu Zhifei;
许志飞;
Li Xiaodan;
李晓丹;
杜江南;
Du Jiangnan;
王桂香;
Wang Guixiang;
马军;
Ma Jun;
Hu Peijin;
胡佩瑾
- 《中国睡眠研究会第十届全国学术年会》
| 2018年
-
摘要:
目的:采用项目反映理论对儿童睡眠问卷进行项目分析,评价儿童睡眠问卷在国内的适用性. 方法:资料来源于2015年对北京市7个城区的3-14岁的儿童的现状调查.采用多阶段分层整群随机抽样方法,随机抽取了西城、朝阳、昌平、顺义、房山、怀柔和门头沟共7个区县的25所幼儿园和中小学学校,共计11420例儿童.纳入的全部儿童采用儿童睡眠问卷调查其睡眠情况,该问卷主要包含与儿童睡眠呼吸障碍相关的4个维度,即呼吸、睡眠、行为、其它.统计分析采用基于二参数logistic模型的项目反应理论,计算各条目的区分度和难度参数,并绘制项目反应特征曲线. 结果:二参数logistic模型的分析结果显示,大多数条目具有较好的区分度,但“睡觉偶尔尿床”和“是否超重”的区分度明显低于其它条目(参数估计值分别为0.441和0.124),且难度参数均较大(分别为4.378和6.172).测验信息量结果提示删除这两个条目后,问卷提供的信息量几乎没有变化. 结论:儿童睡眠问卷在评价儿童睡眠障碍中可以提供较好的初筛效果,但国内应用可以考虑对其进行简化.
-
-
LUO Fang;
罗芳;
LIU Fengbing;
刘凤斌
- 《2014亚洲华人生存质量学术交流会》
| 2014年
-
摘要:
目的:通过项目反应理论分析中华慢性肝病PRO量表,筛选出具有较好项目质量的条目,简化和优化量表.rn 方法:用量表在多个中心对220例不同肝病病种的慢性患者进行测评,用MULTILOG7.03软件分析条目的区分度、难度和信息量绘制项目特征曲线和信息函数曲线.rn 结果:1.大多数条目的ICC分布范围较广,条目曲线没有完全被某一条曲线掩盖,且峰值未出现重合或逆反;信息函数显示大部分条目在一定能力水平范围内项目信息量较大,误差较小.2.量表的区分度分布在0.44~2.49之间,条目难度分布在-8.62~5.47之间,在(-4.00,+4.00)区间较集中,每个条目从1到4级呈单项递增.量表条目的平均信息量分布在0.053~1.413.rn 结论:根据项目反应理论分析的结果对各条目进行分析和评估,最终筛选出具有较好区分度、难度和较高信息量的40+1条条目,弥补经典测试理论的不足.
-
-
潘海燕
- 《2014亚洲华人生存质量学术交流会》
| 2014年
-
摘要:
目的:分析探讨项目反应理论在慢性病患者生命质量测定量表体系共性模块研究中的应用.rn 方法:用项目反应理论对慢性病患者在量表测量体系共性模块的难度和区分度进行分析.rn 结果:30个条目的区分度都在1.17~1.88之间,每个条目从1~4级呈单向递增,难度参数为-2.88~2.27.rn 结论:慢性病患者生命质量测定量表体系共性模块具有较好的难度和区分度均不存在逆反,可以作为中国慢性病患者生命质量的测评工具.
-
-
阮佳慧;
盛展辉;
江波
- 《第22届全球华人计算机教育应用大会》
| 2018年
-
摘要:
在线学习常常需要等质试卷来实施网络环境下的学习评价和测试,而目前的组卷系统大多在给定知识点覆盖和难度系数等的简单约束下从题库随机抽题,试卷质量得不到保证.本研究以项目反应理论(ItemResponse Theory,IRT)作为试卷质量的评估标准,先用分支定界优化算法从题库中产生若干道试题,再用最大团算法从备选试卷中生成差异化最大的一组等质试卷.用户可选的组卷参数包括题目类型,每种题型的题数和排列方式,考察知识点范围和每个知识点所占比例,试卷难度系数分布和区分度系数,试卷间的最大重叠题数和需要生成试卷的数量.系统生成的试卷严格满足题型约束,知识点覆盖约束和最大重叠题数约束,最小化知识点比例差异,根据IRT理论求出的信息函数差异,最大化出卷数量.
-
-
梁月英
- 《第十届全国高等师范院校生物学课程与教学论学术论坛》
| 2014年
-
摘要:
以2014年广东高考理科综合第28题遗传题为基础,选取其中部分内容设计4个项目,每个项目设置不同的难度等级,每个难度等级给予相应的得分等级.依据项目反应理论等级反应模型,用PARSCALE4.1软件对4个项目考生的答题数据进行量化统计.结果显示:学生较易掌握对常染色体遗传病的判断,对性染色体遗传病的判断显得较难掌握,特别是对伴性遗传隐形遗传病的判断显得更加困难;而对隐形遗传病携带者后代患病几率的计算尤为困难,是学生最难掌握的内容.这些结果为教师在今后的教学过程中调整教学策略、指导学生作答遗传题等方面提供了一定的依据.
-
-
万利平;
贺润莲;
余红梅
- 《2014亚洲华人生存质量学术交流会》
| 2014年
-
摘要:
目的:为中国大陆阿尔茨海默病生命质量测评量表(Quality of Life-Alzheimer's Disease,QOL-AD)中文版的使用提供理论依据.方法:调查对象为200名阿尔茨海默病患者,采用项目反应理论对阿尔茨海默病生命质量量表中文版进行条目分析.结果:量表各条目的区分度分别为1.45~3.56,各条目的难度系数在-3到3之间,且没有逆反阈值,所有条目的ICC均达理想状态,信息含量很高.结论:阿尔茨海默病生命质量量表中文版具有很好的心理测量学特性,可以用于测量中国大陆阿尔茨海默病患者生命质量.
-
-
Chunyu Li;
Ling Peng;
Geng Cui
- 《2013年JMS第十届中国营销科学学术年会暨博士生论坛》
| 2013年
-
摘要:
在评估新产品概念时,实践者在采纳多项目方法方面很缓慢.根据项目反应理论,本研究采用了项目功能差异方法评估项目水平上的偏差和影响.基于一个网上概念测试的实验,研究一发现,在一个多项目的量表中,大部分项目在重大创新和细微创新中表现了显著并且很大的项目功能差异;这表明应该为测试重大创新和细微创新发展不同的规范性基准.研究二评估了2001年至2009年间329部电影样本的受欢迎程度,并表明虽然两种不同的评价数据来源(普通消费者vs影评专家)在区分不同电影受欢迎程度方面只显示了不大的差异,这种差异在比较熟悉的电影和不熟悉的电影小组样本时更显著.这些结果支持了项目功能差异是评估和挑选新产品概念,实现有效的概念测试和市场规划的一个很有前景的方法.
-
-
-
胡小甜;
张敏强
- 《第十届海峡两岸心理与教育测验学术研讨会暨全国教育与心理统计测量学术年会》
| 2012年
-
摘要:
本研究依据Chien(2008)的做法对GIRM模型进行了改良,并将改良后的方差分量估计方法称之为GIRM方法,并将其应用到p×i设计的模拟数据中,探讨在不同参数分布形态下G1RM方法和传统GT方法的适用性。结论:1、在不同被试能力分布情况下,两种方法对于σ2(p)所得结果有所差异,GIRM在大部分情况下对方法σ2(P)估计的准确性略差于传统GT方法。2.在不同题目难度分布情况下,两种方法对于σ2(i)所得结果有所差异,GIRM方法在βi~Beta(0.5,0.5)情况下对σ2(i)的估计准确性显著差于传统GT方法,在其他参数分布情况下,GIRM方法则略优于传统GT方法.3.两种方法对于σ2(pie)估计的准确性在任何参数分布形态下都大致相当,优劣并无统一规律.
-
-
胡小甜;
张敏强
- 《第十届海峡两岸心理与教育测验学术研讨会暨全国教育与心理统计测量学术年会》
| 2012年
-
摘要:
本研究依据Chien(2008)的做法对GIRM模型进行了改良,并将改良后的方差分量估计方法称之为GIRM方法,并将其应用到p×i设计的模拟数据中,探讨在不同参数分布形态下G1RM方法和传统GT方法的适用性。结论:1、在不同被试能力分布情况下,两种方法对于σ2(p)所得结果有所差异,GIRM在大部分情况下对方法σ2(P)估计的准确性略差于传统GT方法。2.在不同题目难度分布情况下,两种方法对于σ2(i)所得结果有所差异,GIRM方法在βi~Beta(0.5,0.5)情况下对σ2(i)的估计准确性显著差于传统GT方法,在其他参数分布情况下,GIRM方法则略优于传统GT方法.3.两种方法对于σ2(pie)估计的准确性在任何参数分布形态下都大致相当,优劣并无统一规律.