首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
正项目反应理论(item response theory,IRT)属于现代测量理论的一种,是针对经典测量理论(classic test theory,CTT)在实践中的局限性而提出的,其主要优点为参数和能力估计的不变性~([1])。除此之外,IRT在量表编制中优于CTT的三个特点:CTT注重量表的整体特性,而IRT则关注构成量表的每一条目的特性;根据待测潜在特质水平选择项目;对项目和量表特性的  相似文献   

2.
目的 应用经典测量理论(classical test theory, CTT)和项目反应理论(item response theory, IRT)对慢性肺源性心脏病生命质量测定量表[QLICD-CPHD(V2.0)]进行条目分析与评价。方法 采用QLICD-CPHD(V2.0)量表对184名慢性肺源性心脏病患者进行调查,运用经典测量理论中的相关系数法、变异度法、因子分析法、克朗巴赫系数法对QLICD-CPHD(V2.0)量表的条目进行分析评定,同时运用项目反应理论中的Samejima等级反应模型计算量表每个条目的难度、信息量和区分度系数。结果 CTT结果提示存在7个条目不满足至少3种的统计学要求,其中共性模块6个,特异模块1个。IRT结果显示条目区分度范围为1.18~1.44较为适宜。难度系数随难度等级(B1→B4)增加而单调递增,存在部分条目难度系数b超过标准值范围。各条目平均信息量分布在0.185~0.576。结论 经CTT与IRT分析,QLICD-CPHD(V2.0)量表的大部分条目质量较高,具有较好的区分度,但仍有少量条目需进一步分析和修订。  相似文献   

3.
正项目反应理论(item response theory,IRT)也称条目反应理论,广泛用于教育学、心理学及医学量表测验中。Parscale软件是实现IRT理论的常用软件,由Eiji M uraki和Darrell Bock等开发,现在由Scientific Softw are International(SSI)公司拥有(http://w w w.ssicentral.com/irt/)。Parscale软件可以用于二  相似文献   

4.
目的运用项目反应理论(IRT)对居民健康素养调查问卷的条目进行测评,探讨基于信息函数建立居民健康素养标准参照测验并评价项目性能。方法以1000例健康素养调查样本为例,利用单维三参数logistic模型(3PLM)拟合样本,估计项目参数与信息函数,以掌握水平比例的能力水平作为决策点(测验划界分数)。结果问卷73个项目的三参数logistic模型拟合优度98.6%,难度在-4.27~4.23,区分度在0.32~1.58,猜测度在0.009~0.5,测验在能力水平为-0.13时获得最大信息量与最小测量误差,对应的掌握比例为0.62(划界分数)。结论 IRT在问卷的测评编制中能深刻而合逻辑地分析每个测验项目与整个测验间的定量关系,2013版《江苏省居民健康素养调查问卷》在中低能力水平的被试中具有较高测量精度。  相似文献   

5.
张昊  尚磊 《实用预防医学》2019,26(3):381-385
量表广泛运用在心理学和教育学中,而在医学研究中,许多疾病状态和不健康行为等,只能通过量表测量和间接地测评。但量表编制在医学领域的运用中还显得有些滞后和不足。本文将已在心理学和教育学量表经过验证的量表编制中经常使用的测量学理论,即经典测量理论(classical test theory, CTT)、概化理论(generalizability theory,GT)和项目反应理论(item response theory,IRT)三大类,加以介绍。CTT理论广泛运用在医学量表编制中,具有简便易行、计算准确等优点,但其只适用于简单线性模型,限制了其在医学中的应用,而在教育学和心理学试卷及量表编制中,已开发引入了更为前沿的测量理论。GT理论作为CTT理论的补充,在同时考虑多个误差来源的基础上进行信度估计,信度估计比CTT更为细致和准确。IRT理论引入非线性模型及相关参数,可对量表条目进行更为细致和深入的研究分析,提升量表条目质量。但因以上两套理论实施复杂和学科之间壁垒存在等原因,一直未出现在医学量表编制中,如果使其在将来的医学量表的编制中得到充分广泛的运用和验证,将有重要的理论和现实意义。  相似文献   

6.
目的 运用经典测量理论(CTT)和项目反应理论(IRT)对药物成瘾生命质量测定量表QLICD-DA(V2.0)的条目进行进一步分析。方法 采用QLICD-DA(V2.0)对192名药物成瘾患者进行调查,利用IRT中的Samejima模型计算每个条目的平均信息量、区分度和难度系数,并结合CTT中的克朗巴赫法、变异度法、相关系数法和因子分析法四种统计方法对条目进行分析。结果 在IRT分析中,除了条目GPH1、GPH2、GPH3、GPH4、GPH5、GPH9,其余条目平均信息量都大于0.11,区分度0.79~2.30,难度系数都在-5.07~3.38,且随难度等级(B1→B4)增加而单调递增;在CTT分析中一共有28条目均满足3种及以上的统计方法要求,结合CTT和IRT共选出39个条目。结论 QLICD-DA(V2.0)的大部分条目性能良好,但仍有部分条目需要进一步评价和修订。  相似文献   

7.
项目反应理论及其在生存质量研究中的应用   总被引:1,自引:4,他引:1  
一、经典测量理论的缺陷 20世纪初,Spearman发表了《认知的规律和智慧的本质》与《人类的能力》等文,提出因子分析的方法后,经典测验理论研究开始蓬勃发展。经典测验理论(classical test theory,CTT)主要指真分数理论,其基本思想是把测验的得分(通常称为测验的观察分)看作真分数和误差分数的线性组合,可归结为如下简单数学模型:X=T+e,X是观测分数,T是真分数,e是误差分。传统信度、效度、项目分析的原理与方法均建立在这一模型之上。  相似文献   

8.
目的 应用 CTT 与 IRT 两种分析理论对宫颈癌患者生命质量量表(QLICP-CE V2.0)的条目进行分析与评价。 方法 通过应用 QLICP-CE(V2.0)对 186 例宫颈癌病人进行测评,采用经典测量理论 CTT 中的四种统计方法(变异度法、相关系数法、因子分析法、克朗巴赫系数法)来评价条目质量的好坏。同时采用项目反应理论IRT中的 Samejima 等级反应模型计算每个条目的难度、区分度系数和信息量。 结果 CTT 分析结果提示 QLICP-CE(V2.0)共性模块中有 9 个条目与其所在领域的相关性比较低,而特异模块中有3个。IRT结果显示所有条目的区分度较好,取值范围均在0.64~1.33;44个条目中有35个条目的难度系数取值范围在-3.49~3.76,且随着难度等级(B1→B4)的增加呈现出单调递增的趋势;除 3 个条目外所有条目的平均信息量均较好。 结论 QLICP-CE(V2.0)量表所有条目区分度比较好,大部分条目的性能良好,但仍然有少部分条目有待进一步修订并验证效果。  相似文献   

9.
目的 编制毒品成瘾多维心理因素评估量表,并检验其心理测量特性。方法 在半结构化访谈、文献调研的基础上,从风险因素和保护因素两方面入手,并基于个体心理和社会心理两系统确立最常见的11个维度,构建毒品成瘾多维心理因素评估初始量表,通过两次修订形成最终量表。随后对316名吸毒者进行正式量表测试。用经典测量理论(classical test theory,CTT)和项目反应理论(item response theory,IRT)的拓展分部评分模型(generalized partial credit model,GPCM)的方法对量表进行项目质量分析,采用R语言、Mplus 7.0和SPSS 21.0进行数据分析。结果 正式量表包括64个条目,4个分量表和11个因子。量表的Cronbach α系数为0.95,重测信度为0.65。验证性因素分析的结果表明量表具有良好的结构效度。最终在CTT框架下量表的项目区分度在0.40~0.84之间,难度在0.28~0.68之间,IRT框架下量表的项目区分度在0.40~5.18之间,项目难度参数在-1.06~2.70之间。结论 该量表符合心理测量学要求,可以作为吸毒人员成瘾的评估工具。  相似文献   

10.
项目反应理论及计算机自适应测验是心理测量领域新近发展起来的测量技术。与传统测量方法相比,这种方法可以在更短的时间内、利用更少的题目、更准确的测量被试的水平。目前这种方法已在能力测验领域得到了广泛的使用,在,临床心理评估方面的实践也已逐渐开展。为了促进项目反应理论及计算机自适应测验在我国临床心理评估的应用,研发实用的测评系统,为临床医生提供患者的一般心理状况,本文综述了该领域目前主要的研究现状,并指出了其发展的方向。  相似文献   

11.
目的 运用项目反应理论(IRT)对慢性病患者生命质量测定量表共性模块(QLICD-GM)条目进行分析,筛选信息量较高条目.方法 应用QLICD-GM测评7种慢性病患者620例,采用塞姆吉玛等级反应模型计算每个条目的难度、区分度系数和信息量,绘制项目特征曲线;根据平均信息量筛选条目;采用MULTILOG 7.0软件进行计算和作图.结果 QLICD-GM共性模块29个条目的区分度均为1.2~1.9;难度(程度)均呈严格单调递增,取值范围为-3.05 ~2.18;依据平均信息量,结合条目特征筛选保留24个条目.结论 QLICD-GM各条目区分度均较好、选项设置合理、难度合适,分析模型选择正确;项目反应理论可筛选出信息量较高条目,弥补经典测量理论(CTT)的不足.  相似文献   

12.
项目反应理论在SF-36心理测量学特征评价中的应用   总被引:1,自引:0,他引:1  
目的使用项目反应理论(item response theory,IRT)对SF-36量表进行分析,探讨更适合于量表分析的方法。方法采用横断面研究。使用SF-36量表调查526例确诊的鼻咽癌患者,使用部分评分模型对反映生理健康的21个条目进行分析:计算PSI(person separation index),估计阈值参数和生存质量,对性别、年龄、婚姻等进行项目功能差异(DIF)分析。结果 PSI=0.85,整个模型的拟合效果好;除了条目3i、3j、8的阈值参数顺序出现颠倒外,其余条目均符合理论假设;DIF分析结果显示,所有的条目都没有非一致性DIF,条目4a在性别上存在一致性DIF,条目3g、10a在病人来源上存在一致性DIF。结论 SF-36生理健康的21个条目基本满足单维性、局部独立性的要求,可以放在一起进行IRT分析。IRT能够克服等级资料的限制,能力参数与阈值参数定义在同一个标尺上,而且存在参数不变性的优点,更加适合量表的分析评价。  相似文献   

13.
养生是传统东方国家的健康促进生活方式,是引领个体维持和提高安宁幸福、实现健康潜能的行为,与老年人的生活质量、幸福感密切相关[1-3].养生量表(Tools in Measuring Yangseng)是Kim[4]以韩方医学中的养生理论为指导开发的养生水平评估工具.在前期研究中,本课题组经授权引进该量表,利用探索性因子分析与验证性因子分析相结合的方法对养生量表中文版的结构效度、内在一致性等进行了初步探讨.但目前对于养生量表各条目的鉴别力、类别反应阈值及评分方法等问题还鲜有分析.本研究利用项目反应理论(item response theory,IRT)对养生量表条目功能、评分方法等进行分析,旨在为设计出适合中国人群特点的养生评估工具提供参考依据.  相似文献   

14.
目的开发公共卫生安全素养量表, 为我国公众的公共卫生安全素养测评提供适宜工具。方法通过理论构想、指标池构建、现场验证、题项缩减等步骤编制中国公共卫生安全素养初始量表, 转为"问卷星"电子问卷, 随机抽取4个省份共2 809名居民进行现场测试。利用经典测试理论(CTT)和项目反应理论(IRT)进行题项缩减。使用SPSS 23.0软件进行探索性因子分析(EFA)和单维性检验。使用R 4.1.1软件ltm和mirt包进行题项的心理测量学指标分析, 并绘制项目特征曲线(ICC)和信息函数曲线(IIC和TIF)。结果选用专家一致性系数最优的初始量表3, 共30个题项(B1~B30), 测试对象完成1个题项平均需9.8 s。根据CTT分析, 删除校正题项-总相关系数(CITC)<0.3及题项-维度相关系数(IDCC)<0.4的B2题项;删除CITC<0.3、IDCC<0.4及难度指数<0.2的B23题项;删除CITC<0.3及难度指数<0.2的B30题项。删除后量表总内部一致性信度(Cronbach’’sα)值为0.923。EFA提示删除14个因子载荷较小...  相似文献   

15.
项目反应理论(Item Response Theory,IRT)自从20世纪80年代引入我国以来,在教育研究和心理测量的许多领域都开展起来,并取得了显著成果,但是在医学教育测量领域中所进行的研究较少。其中Rasch模型是项目反应理论中数学表达形式最简单的模型,属于标准指数函数,数学基础坚实,参数估计结果稳定可靠,因此常被用来建立对各评分指标(项目)进行信度、效度分析,以及确定项目难度等级。  相似文献   

16.
张楠  汪凯  梁振 《疾病控制杂志》2012,16(5):431-434
目的 探讨网络游戏成瘾被试与正常对照在执行功能上的差异,为其他类型网络成瘾执行功能的研究提供参考,并为网络成瘾脑机制和神经心理学方面的进一步研究及临床干预提供依据.方法 采用与前额叶执行功能相关的数字颜色连线测验(color trail test,CTT)和中文版Stroop测验(Stroop test,ST),研究26名网络游戏成瘾被试和24名正常对照的注意转换、选择性注意及反应抑制等能力,比较两组执行功能的差异.结果 网络游戏成瘾组完成CTT中连线Ⅰ和连线Ⅱ的时间均比对照组短,且在连线Ⅱ中差异有统计学意义(t=-3.60,P=0.001),连线干扰效应时间也短于对照组(t=-3.50,P=0.001).在Stroop测验中,网络游戏成瘾组在Stroop-A、Stroop-B和Stroop-C中的错误数均与对照组无差异;而在反应时上,网络游戏成瘾组在Stroop-A、Stroop-B和Stroop-C中的反应时均短于对照组,且在Stroop-B和Stroop-C中,两组的反应时差异有统计学意义(均有P<0.05);此外,网络游戏成瘾组的Stroop干扰效应也短于对照组(t=-3.80,P<0.001).结论 网络游戏成瘾被试的执行功能优于正常对照.研究结果为网络成瘾脑机制和神经心理学方面的相关研究以及临床应用提供了参考依据.  相似文献   

17.
目的 应用经典测量理论与项目反应理论对慢性胃炎患者生命质量量表QLICD-CG(V2.0)的条目进行分析。方法 采用QLICD-CG(V2.0)量表,对163名慢性胃炎患者进行生命质量评估。利用Multilog 7.03软件进行项目反应理论分析得出每个条目的难度、区分度系数和信息量,同时结合经典测量理论分析的4种统计方法来评价条目质量的优劣。结果 CTT结果显示,除了3个条目(GPH3、GPS3、CG11)外,剩余条目都符合4种统计学方法至少满足3种的标准;IRT结果显示,所有条目的难度系数都在-6.42~4.36,而且随着难度等级(B1→B4)增加呈现出单调递增的趋势,所有条目的区分度都在1.37~1.69,所有条目的平均信息量都在0.356~0.780。39个条目中,37个条目的性能良好,2个条目(GPH3、GPS3)需要优化。结论 QLICD-CG(V2.0)量表的大部分条目的性能较好,但少数条目仍需进一步改进。  相似文献   

18.
目的 利用项目反应理论(item response theory,IRT)对《中国版职业紧张核心量表》质量进行分析与评价,为后期量表使用和修订提供参考依据。方法 采用方便抽样方法,抽取湖北省两家三甲医院和多家一、二级医院共1261名医务人员作为研究对象,应用《中国版职业紧张核心量表》调查其职业紧张情况。采用主成分分析验证量表4个维度的单维性。采用IRT中的Same Jima等级反应模型计算每个条目的区分度、难度系数和信息量,从微观角度评价量表的测量特性。结果 量表4个维度均满足单维性假设。IRT结果显示所有条目的区分度较好,取值范围在0.67~3.10;17个条目中有13个条目的难度系数在-2.78~2.30之间,且不存在难度逆反现象,条目9和11难度过高且难度逆反,条目15和16难度过低过高并存且有难度逆反现象,提示待改进;除了条目9、11和15提供的信息量中等,条目16和17提供的信息量较差以外,其余条目的信息量均较好。结论 《中国版职业紧张核心量表》所有条目的区分度较好。从难度系数和信息量两个角度,条目9、11、15、16、17的测验质量均是有待改进的,其余条目性能良好,建议针对上述分析结果结合专家意见对问题条目进行修订。  相似文献   

19.
正条目反应理论(item response theory,IRT),也称为项目反应理论,受到越来越多的关注,广泛应用于智力、心理量表、考试系统等潜变量的测量。最近几年,在量表的研制中,条目反应理论逐渐应用于条目的评价和选择~([1-3])。如Liu等研制适合中医疗效评价的重症肌无力量表~([4-5]),陈新林等研发鼻咽癌患者生存质量量表~([6]),董丽敏等用于评价哮喘患者PRO量表~([7]),  相似文献   

20.
目的对MHIEC-COPD测试版量表的条目再次分析和筛选,以便形成正式版量表MHIEC-COPD(V1.0)。方法采用测试版老年COPD患者多维健康测评量表,对451例60岁及以上老年COPD患者进行调查。采用项目反应理论IRT中的塞姆吉玛等级反应模型计算每个条目的难度、区分度系数,并结合经典测量理论CTT的四种统计方法来评价条目。结果除共性模块中4个条目(GPH4、GPH9、GPS1、GSO4)外,其余条目3种CTT统计分析均入选。各条目的区分度均在1.00~1.39,所有条目的难度系数均在-5.12~4.49,且随难度等级(B1→B4)增加单调递增。最后结合专家讨论,从21个条目中选出16个条目组成正式版量表ECMH-COPD(V1.0)。结论按严格的程序选出16个条目质量较高具有较好的代表性,其中共性模块9条,特异模块7条。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号