首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
项目反应理论(item response theory,IRT)是一种可以精确测量被试能力的现代测量理论,起源于20世纪30年代末;到70年代,IRT逐渐替代了传统的经典测验理论(classical test theory,CTT),成为了测验理论的重点。IRT模型的特点是建立了项目性能、被试潜在特质水平与项目应答正确概率的关系[1-2]。与CTT相比,IRT中项目的难度、区分度和猜测度更为清晰、易懂,它将项目特性与被试水平定义在同一维度内,避免了对项目和被试的评价过分依赖抽样样本的局限性。  相似文献   

2.
目的 应用经典测量理论(classical test theory, CTT)和项目反应理论(item response theory, IRT)对慢性肺源性心脏病生命质量测定量表[QLICD-CPHD(V2.0)]进行条目分析与评价。方法 采用QLICD-CPHD(V2.0)量表对184名慢性肺源性心脏病患者进行调查,运用经典测量理论中的相关系数法、变异度法、因子分析法、克朗巴赫系数法对QLICD-CPHD(V2.0)量表的条目进行分析评定,同时运用项目反应理论中的Samejima等级反应模型计算量表每个条目的难度、信息量和区分度系数。结果 CTT结果提示存在7个条目不满足至少3种的统计学要求,其中共性模块6个,特异模块1个。IRT结果显示条目区分度范围为1.18~1.44较为适宜。难度系数随难度等级(B1→B4)增加而单调递增,存在部分条目难度系数b超过标准值范围。各条目平均信息量分布在0.185~0.576。结论 经CTT与IRT分析,QLICD-CPHD(V2.0)量表的大部分条目质量较高,具有较好的区分度,但仍有少量条目需进一步分析和修订。  相似文献   

3.
张昊  尚磊 《实用预防医学》2019,26(3):381-385
量表广泛运用在心理学和教育学中,而在医学研究中,许多疾病状态和不健康行为等,只能通过量表测量和间接地测评。但量表编制在医学领域的运用中还显得有些滞后和不足。本文将已在心理学和教育学量表经过验证的量表编制中经常使用的测量学理论,即经典测量理论(classical test theory, CTT)、概化理论(generalizability theory,GT)和项目反应理论(item response theory,IRT)三大类,加以介绍。CTT理论广泛运用在医学量表编制中,具有简便易行、计算准确等优点,但其只适用于简单线性模型,限制了其在医学中的应用,而在教育学和心理学试卷及量表编制中,已开发引入了更为前沿的测量理论。GT理论作为CTT理论的补充,在同时考虑多个误差来源的基础上进行信度估计,信度估计比CTT更为细致和准确。IRT理论引入非线性模型及相关参数,可对量表条目进行更为细致和深入的研究分析,提升量表条目质量。但因以上两套理论实施复杂和学科之间壁垒存在等原因,一直未出现在医学量表编制中,如果使其在将来的医学量表的编制中得到充分广泛的运用和验证,将有重要的理论和现实意义。  相似文献   

4.
目的 编制毒品成瘾多维心理因素评估量表,并检验其心理测量特性。方法 在半结构化访谈、文献调研的基础上,从风险因素和保护因素两方面入手,并基于个体心理和社会心理两系统确立最常见的11个维度,构建毒品成瘾多维心理因素评估初始量表,通过两次修订形成最终量表。随后对316名吸毒者进行正式量表测试。用经典测量理论(classical test theory,CTT)和项目反应理论(item response theory,IRT)的拓展分部评分模型(generalized partial credit model,GPCM)的方法对量表进行项目质量分析,采用R语言、Mplus 7.0和SPSS 21.0进行数据分析。结果 正式量表包括64个条目,4个分量表和11个因子。量表的Cronbach α系数为0.95,重测信度为0.65。验证性因素分析的结果表明量表具有良好的结构效度。最终在CTT框架下量表的项目区分度在0.40~0.84之间,难度在0.28~0.68之间,IRT框架下量表的项目区分度在0.40~5.18之间,项目难度参数在-1.06~2.70之间。结论 该量表符合心理测量学要求,可以作为吸毒人员成瘾的评估工具。  相似文献   

5.
目的 运用经典测量理论(CTT)和项目反应理论(IRT)对药物成瘾生命质量测定量表QLICD-DA(V2.0)的条目进行进一步分析。方法 采用QLICD-DA(V2.0)对192名药物成瘾患者进行调查,利用IRT中的Samejima模型计算每个条目的平均信息量、区分度和难度系数,并结合CTT中的克朗巴赫法、变异度法、相关系数法和因子分析法四种统计方法对条目进行分析。结果 在IRT分析中,除了条目GPH1、GPH2、GPH3、GPH4、GPH5、GPH9,其余条目平均信息量都大于0.11,区分度0.79~2.30,难度系数都在-5.07~3.38,且随难度等级(B1→B4)增加而单调递增;在CTT分析中一共有28条目均满足3种及以上的统计方法要求,结合CTT和IRT共选出39个条目。结论 QLICD-DA(V2.0)的大部分条目性能良好,但仍有部分条目需要进一步评价和修订。  相似文献   

6.
目的 应用 CTT 与 IRT 两种分析理论对宫颈癌患者生命质量量表(QLICP-CE V2.0)的条目进行分析与评价。 方法 通过应用 QLICP-CE(V2.0)对 186 例宫颈癌病人进行测评,采用经典测量理论 CTT 中的四种统计方法(变异度法、相关系数法、因子分析法、克朗巴赫系数法)来评价条目质量的好坏。同时采用项目反应理论IRT中的 Samejima 等级反应模型计算每个条目的难度、区分度系数和信息量。 结果 CTT 分析结果提示 QLICP-CE(V2.0)共性模块中有 9 个条目与其所在领域的相关性比较低,而特异模块中有3个。IRT结果显示所有条目的区分度较好,取值范围均在0.64~1.33;44个条目中有35个条目的难度系数取值范围在-3.49~3.76,且随着难度等级(B1→B4)的增加呈现出单调递增的趋势;除 3 个条目外所有条目的平均信息量均较好。 结论 QLICP-CE(V2.0)量表所有条目区分度比较好,大部分条目的性能良好,但仍然有少部分条目有待进一步修订并验证效果。  相似文献   

7.
正项目反应理论(item response theory,IRT)也称条目反应理论,广泛用于教育学、心理学及医学量表测验中。Parscale软件是实现IRT理论的常用软件,由Eiji M uraki和Darrell Bock等开发,现在由Scientific Softw are International(SSI)公司拥有(http://w w w.ssicentral.com/irt/)。Parscale软件可以用于二  相似文献   

8.
目的 运用项目反应理论(IRT)对慢性病患者生命质量测定量表共性模块(QLICD-GM)条目进行分析,筛选信息量较高条目.方法 应用QLICD-GM测评7种慢性病患者620例,采用塞姆吉玛等级反应模型计算每个条目的难度、区分度系数和信息量,绘制项目特征曲线;根据平均信息量筛选条目;采用MULTILOG 7.0软件进行计算和作图.结果 QLICD-GM共性模块29个条目的区分度均为1.2~1.9;难度(程度)均呈严格单调递增,取值范围为-3.05 ~2.18;依据平均信息量,结合条目特征筛选保留24个条目.结论 QLICD-GM各条目区分度均较好、选项设置合理、难度合适,分析模型选择正确;项目反应理论可筛选出信息量较高条目,弥补经典测量理论(CTT)的不足.  相似文献   

9.
正条目反应理论(item response theory,IRT),也称为项目反应理论,受到越来越多的关注,广泛应用于智力、心理量表、考试系统等潜变量的测量。最近几年,在量表的研制中,条目反应理论逐渐应用于条目的评价和选择~([1-3])。如Liu等研制适合中医疗效评价的重症肌无力量表~([4-5]),陈新林等研发鼻咽癌患者生存质量量表~([6]),董丽敏等用于评价哮喘患者PRO量表~([7]),  相似文献   

10.
目的对MHIEC-COPD测试版量表的条目再次分析和筛选,以便形成正式版量表MHIEC-COPD(V1.0)。方法采用测试版老年COPD患者多维健康测评量表,对451例60岁及以上老年COPD患者进行调查。采用项目反应理论IRT中的塞姆吉玛等级反应模型计算每个条目的难度、区分度系数,并结合经典测量理论CTT的四种统计方法来评价条目。结果除共性模块中4个条目(GPH4、GPH9、GPS1、GSO4)外,其余条目3种CTT统计分析均入选。各条目的区分度均在1.00~1.39,所有条目的难度系数均在-5.12~4.49,且随难度等级(B1→B4)增加单调递增。最后结合专家讨论,从21个条目中选出16个条目组成正式版量表ECMH-COPD(V1.0)。结论按严格的程序选出16个条目质量较高具有较好的代表性,其中共性模块9条,特异模块7条。  相似文献   

11.
目的开发公共卫生安全素养量表, 为我国公众的公共卫生安全素养测评提供适宜工具。方法通过理论构想、指标池构建、现场验证、题项缩减等步骤编制中国公共卫生安全素养初始量表, 转为"问卷星"电子问卷, 随机抽取4个省份共2 809名居民进行现场测试。利用经典测试理论(CTT)和项目反应理论(IRT)进行题项缩减。使用SPSS 23.0软件进行探索性因子分析(EFA)和单维性检验。使用R 4.1.1软件ltm和mirt包进行题项的心理测量学指标分析, 并绘制项目特征曲线(ICC)和信息函数曲线(IIC和TIF)。结果选用专家一致性系数最优的初始量表3, 共30个题项(B1~B30), 测试对象完成1个题项平均需9.8 s。根据CTT分析, 删除校正题项-总相关系数(CITC)<0.3及题项-维度相关系数(IDCC)<0.4的B2题项;删除CITC<0.3、IDCC<0.4及难度指数<0.2的B23题项;删除CITC<0.3及难度指数<0.2的B30题项。删除后量表总内部一致性信度(Cronbach’’sα)值为0.923。EFA提示删除14个因子载荷较小...  相似文献   

12.
目的 应用经典测量理论与项目反应理论对慢性胃炎患者生命质量量表QLICD-CG(V2.0)的条目进行分析。方法 采用QLICD-CG(V2.0)量表,对163名慢性胃炎患者进行生命质量评估。利用Multilog 7.03软件进行项目反应理论分析得出每个条目的难度、区分度系数和信息量,同时结合经典测量理论分析的4种统计方法来评价条目质量的优劣。结果 CTT结果显示,除了3个条目(GPH3、GPS3、CG11)外,剩余条目都符合4种统计学方法至少满足3种的标准;IRT结果显示,所有条目的难度系数都在-6.42~4.36,而且随着难度等级(B1→B4)增加呈现出单调递增的趋势,所有条目的区分度都在1.37~1.69,所有条目的平均信息量都在0.356~0.780。39个条目中,37个条目的性能良好,2个条目(GPH3、GPS3)需要优化。结论 QLICD-CG(V2.0)量表的大部分条目的性能较好,但少数条目仍需进一步改进。  相似文献   

13.
项目反应理论在SF-36心理测量学特征评价中的应用   总被引:1,自引:0,他引:1  
目的使用项目反应理论(item response theory,IRT)对SF-36量表进行分析,探讨更适合于量表分析的方法。方法采用横断面研究。使用SF-36量表调查526例确诊的鼻咽癌患者,使用部分评分模型对反映生理健康的21个条目进行分析:计算PSI(person separation index),估计阈值参数和生存质量,对性别、年龄、婚姻等进行项目功能差异(DIF)分析。结果 PSI=0.85,整个模型的拟合效果好;除了条目3i、3j、8的阈值参数顺序出现颠倒外,其余条目均符合理论假设;DIF分析结果显示,所有的条目都没有非一致性DIF,条目4a在性别上存在一致性DIF,条目3g、10a在病人来源上存在一致性DIF。结论 SF-36生理健康的21个条目基本满足单维性、局部独立性的要求,可以放在一起进行IRT分析。IRT能够克服等级资料的限制,能力参数与阈值参数定义在同一个标尺上,而且存在参数不变性的优点,更加适合量表的分析评价。  相似文献   

14.
目的用经典测量理论(Classical test theory,CTT)分析慢性病患者生命质量测定量表体系共性模块(QLICD-GM)每个条目的难度与区分度。方法调查8种慢性病的1024例患者,采用经典测量理论计算每个条目的难度、区分度系数,采用SPSS软件进行计算和作图。结果共性模块条目难度适中,不是太难也不是太简单。条目的区分度总体适中,但是个别条目区分度过低,比如生理领域的条目PH2、PH6、PH7,需要对条目加以考虑。结论慢性病患者生命质量测定量表体系共性模块具有较好的难度和区分度,可以作为我国慢性病患者生命质量的测评工具,但QLICD-GM(V1.0)的理论结构还有待进一步补充完善。  相似文献   

15.
目的 利用项目反应理论(item response theory,IRT)对《中国版职业紧张核心量表》质量进行分析与评价,为后期量表使用和修订提供参考依据。方法 采用方便抽样方法,抽取湖北省两家三甲医院和多家一、二级医院共1261名医务人员作为研究对象,应用《中国版职业紧张核心量表》调查其职业紧张情况。采用主成分分析验证量表4个维度的单维性。采用IRT中的Same Jima等级反应模型计算每个条目的区分度、难度系数和信息量,从微观角度评价量表的测量特性。结果 量表4个维度均满足单维性假设。IRT结果显示所有条目的区分度较好,取值范围在0.67~3.10;17个条目中有13个条目的难度系数在-2.78~2.30之间,且不存在难度逆反现象,条目9和11难度过高且难度逆反,条目15和16难度过低过高并存且有难度逆反现象,提示待改进;除了条目9、11和15提供的信息量中等,条目16和17提供的信息量较差以外,其余条目的信息量均较好。结论 《中国版职业紧张核心量表》所有条目的区分度较好。从难度系数和信息量两个角度,条目9、11、15、16、17的测验质量均是有待改进的,其余条目性能良好,建议针对上述分析结果结合专家意见对问题条目进行修订。  相似文献   

16.
养生是传统东方国家的健康促进生活方式,是引领个体维持和提高安宁幸福、实现健康潜能的行为,与老年人的生活质量、幸福感密切相关[1-3].养生量表(Tools in Measuring Yangseng)是Kim[4]以韩方医学中的养生理论为指导开发的养生水平评估工具.在前期研究中,本课题组经授权引进该量表,利用探索性因子分析与验证性因子分析相结合的方法对养生量表中文版的结构效度、内在一致性等进行了初步探讨.但目前对于养生量表各条目的鉴别力、类别反应阈值及评分方法等问题还鲜有分析.本研究利用项目反应理论(item response theory,IRT)对养生量表条目功能、评分方法等进行分析,旨在为设计出适合中国人群特点的养生评估工具提供参考依据.  相似文献   

17.
目的 探讨单维条目反应理论与多维条目反应理论在多维量表分析中的差异,并从中找出较优的分析方法.方法 用单维分部评分模型(PCM)和多维分部评分模型分别对世界卫生组织生存质量研究小组提供的来自世界20个研究中心的WHOQOL-OLD量表数据进行条目和量表结构的分析.结果 "感觉能力"领域中的条目OLD_10 "您的感觉功能的问题影响您和他人交往的能力吗?"同时不拟合两种模型,单维IRT得到Infit和Outfit均方拟合指数、6个维度的信度系数及潜在特质间的相关系数均低于多维IRT.结论 多维IRT更适合于条目数较少的多维量表的分析和评价.  相似文献   

18.
目的运用项目反应理论(IRT)对居民健康素养调查问卷的条目进行测评,探讨基于信息函数建立居民健康素养标准参照测验并评价项目性能。方法以1000例健康素养调查样本为例,利用单维三参数logistic模型(3PLM)拟合样本,估计项目参数与信息函数,以掌握水平比例的能力水平作为决策点(测验划界分数)。结果问卷73个项目的三参数logistic模型拟合优度98.6%,难度在-4.27~4.23,区分度在0.32~1.58,猜测度在0.009~0.5,测验在能力水平为-0.13时获得最大信息量与最小测量误差,对应的掌握比例为0.62(划界分数)。结论 IRT在问卷的测评编制中能深刻而合逻辑地分析每个测验项目与整个测验间的定量关系,2013版《江苏省居民健康素养调查问卷》在中低能力水平的被试中具有较高测量精度。  相似文献   

19.
目的 运用经典测量理论与项目反应理论对消化性溃疡患者生命质量量表QLICD-PU(V2.0)的条目进行分析与评价,为量表的改进与完善提供依据。方法 应用QLICD-PU(V2.0)对170例消化性溃疡患者进行测评,采用经典测量理论中的变异度法、相关系数法、因子分析法、克朗巴赫系数法,同时应用项目反应理论中的Samejima等级反应模型计算每个条目的难度、区分度系数和信息量,来评价QLICD-PU(V2.0)量表条目的质量。结果 经典测量理论结果提示QLICD-PU(V2.0)共性模块中变异法计算在总的41个条目中条目标准差小于0.90的有7个; 在总的41个条目中有9个条目与其所在领域的相关性比较低; 项目反应理论结果显示所有条目的区分度较好,取值范围均在1.01~1.69; 在总的41个条目中33个条目的难度系数取值范围在-3.94~3.70,且随着难度等级(B1→B4)的增加呈现出单调递增的趋势; 共性模块条目的平均信息量均较好,特异模块的平均信息量不太理想。结论 QLICD-PU(V2.0)量表所有条目区分度,大部分条目的难度以及共性模块平均信息量比较好,量表具较好的信度,但仍然有部分条目有待进一步修订并验证效果。  相似文献   

20.
量表在现代医学研究中的应用越来越广。对条目池中的条目进行筛选是量表研制的重要过程,而量表条目的统计学筛选方法是条目筛选的重要方法。目前比较常用的统计学筛选方法大都基于经典测量理论、概化理论和条目反应理论,如经典测量理论中的离散趋势法、相关系数法、因子分析法等;概化理论中的概化系数法;条目反应理论中的信息函数和项目功能差异法。本文将对以上三种理论下的量表条目筛选方法进行综述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号