首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
目的 探讨项目反应理论中的等级反应模型在基于冠心病患者报告临床结局量表(CHD-PRO)条目筛选中的应用.方法 对CHD-PRO初始量表所有条目拟合等级反应模型,依据区分度参数和难度等级参数对条目进行评价和筛选.结果 通过等级反应模型理论对量表条目进行筛选,初始量表共计62个条目,建议删除12个条目.结论 与经典测量理论和传统方法相比,项目反应理论与等级反应模型能够克服等级资料的限制,增加了对受试对象能力的估计,更加适合量表条目的筛选.  相似文献   

2.
目的 应用经典测量理论(classical test theory, CTT)和项目反应理论(item response theory, IRT)对慢性肺源性心脏病生命质量测定量表[QLICD-CPHD(V2.0)]进行条目分析与评价。方法 采用QLICD-CPHD(V2.0)量表对184名慢性肺源性心脏病患者进行调查,运用经典测量理论中的相关系数法、变异度法、因子分析法、克朗巴赫系数法对QLICD-CPHD(V2.0)量表的条目进行分析评定,同时运用项目反应理论中的Samejima等级反应模型计算量表每个条目的难度、信息量和区分度系数。结果 CTT结果提示存在7个条目不满足至少3种的统计学要求,其中共性模块6个,特异模块1个。IRT结果显示条目区分度范围为1.18~1.44较为适宜。难度系数随难度等级(B1→B4)增加而单调递增,存在部分条目难度系数b超过标准值范围。各条目平均信息量分布在0.185~0.576。结论 经CTT与IRT分析,QLICD-CPHD(V2.0)量表的大部分条目质量较高,具有较好的区分度,但仍有少量条目需进一步分析和修订。  相似文献   

3.
项目反应理论在SF-36心理测量学特征评价中的应用   总被引:1,自引:0,他引:1  
目的使用项目反应理论(item response theory,IRT)对SF-36量表进行分析,探讨更适合于量表分析的方法。方法采用横断面研究。使用SF-36量表调查526例确诊的鼻咽癌患者,使用部分评分模型对反映生理健康的21个条目进行分析:计算PSI(person separation index),估计阈值参数和生存质量,对性别、年龄、婚姻等进行项目功能差异(DIF)分析。结果 PSI=0.85,整个模型的拟合效果好;除了条目3i、3j、8的阈值参数顺序出现颠倒外,其余条目均符合理论假设;DIF分析结果显示,所有的条目都没有非一致性DIF,条目4a在性别上存在一致性DIF,条目3g、10a在病人来源上存在一致性DIF。结论 SF-36生理健康的21个条目基本满足单维性、局部独立性的要求,可以放在一起进行IRT分析。IRT能够克服等级资料的限制,能力参数与阈值参数定义在同一个标尺上,而且存在参数不变性的优点,更加适合量表的分析评价。  相似文献   

4.
目的 应用 CTT 与 IRT 两种分析理论对宫颈癌患者生命质量量表(QLICP-CE V2.0)的条目进行分析与评价。 方法 通过应用 QLICP-CE(V2.0)对 186 例宫颈癌病人进行测评,采用经典测量理论 CTT 中的四种统计方法(变异度法、相关系数法、因子分析法、克朗巴赫系数法)来评价条目质量的好坏。同时采用项目反应理论IRT中的 Samejima 等级反应模型计算每个条目的难度、区分度系数和信息量。 结果 CTT 分析结果提示 QLICP-CE(V2.0)共性模块中有 9 个条目与其所在领域的相关性比较低,而特异模块中有3个。IRT结果显示所有条目的区分度较好,取值范围均在0.64~1.33;44个条目中有35个条目的难度系数取值范围在-3.49~3.76,且随着难度等级(B1→B4)的增加呈现出单调递增的趋势;除 3 个条目外所有条目的平均信息量均较好。 结论 QLICP-CE(V2.0)量表所有条目区分度比较好,大部分条目的性能良好,但仍然有少部分条目有待进一步修订并验证效果。  相似文献   

5.
量表在现代医学研究中的应用越来越广。对条目池中的条目进行筛选是量表研制的重要过程,而量表条目的统计学筛选方法是条目筛选的重要方法。目前比较常用的统计学筛选方法大都基于经典测量理论、概化理论和条目反应理论,如经典测量理论中的离散趋势法、相关系数法、因子分析法等;概化理论中的概化系数法;条目反应理论中的信息函数和项目功能差异法。本文将对以上三种理论下的量表条目筛选方法进行综述。  相似文献   

6.
目的 利用项目反应理论(item response theory,IRT)对《中国版职业紧张核心量表》质量进行分析与评价,为后期量表使用和修订提供参考依据。方法 采用方便抽样方法,抽取湖北省两家三甲医院和多家一、二级医院共1261名医务人员作为研究对象,应用《中国版职业紧张核心量表》调查其职业紧张情况。采用主成分分析验证量表4个维度的单维性。采用IRT中的Same Jima等级反应模型计算每个条目的区分度、难度系数和信息量,从微观角度评价量表的测量特性。结果 量表4个维度均满足单维性假设。IRT结果显示所有条目的区分度较好,取值范围在0.67~3.10;17个条目中有13个条目的难度系数在-2.78~2.30之间,且不存在难度逆反现象,条目9和11难度过高且难度逆反,条目15和16难度过低过高并存且有难度逆反现象,提示待改进;除了条目9、11和15提供的信息量中等,条目16和17提供的信息量较差以外,其余条目的信息量均较好。结论 《中国版职业紧张核心量表》所有条目的区分度较好。从难度系数和信息量两个角度,条目9、11、15、16、17的测验质量均是有待改进的,其余条目性能良好,建议针对上述分析结果结合专家意见对问题条目进行修订。  相似文献   

7.
目的 采用多维项目反应理论(MIRT)理论对“学龄前儿童饮食行为量表”进行进一步的条目评估,探索MIRT理论在医学量表编制中的可行性和有效性,编制出更加完善精简的“学龄前儿童饮食行为量表”,为我国儿童饮食行为评价和相关研究提供基本工具。方法 广泛查阅国内外相关文献,2017年6月以西安市城、郊3~6岁儿童“学龄前儿童饮食行为量表”测试结果为基础,采用MIRT下的条目区分度、难度和猜测系数对各条目进行评价和筛选,采用Cronbach’s α系数、分半信度系数、重测信度系数以及因子分析等对修订后的量表的信度、效度、反应度进行再检验,并与原量表进行对比。结果 依据MIRT下的条目区分度、难度和维度载荷共删除3个条目,并调整了1个条目的维度归属。修订的量表同质信度Cronbach’s α系数为0.94,Guttman分半信度系数为0.81,重测信度系数为0.73,探索性因子分析显示累积方差贡献率为59.04%,验证性因子分析显示范拟合指数(NFI)=0.86,非范拟合指数(NNFI)=0.92,比较拟合指数(CFI)=0.93,均方根残差(RMSR)=0.04。不同体重分集在过饱响应、食物响应、挑食、不良进食习惯维度得分上差异均有统计学意义(P<0.05)。修订后量表的信度、效度和区分度各类指标中大部分都优于原量表。结论 MIRT理论下的条目筛选方法可进一步调高量表的信度和效度,使量表更加精简,新修订的学龄前儿童饮食行为量表更适合于儿童饮食行为问题的评估和研究。  相似文献   

8.
目的 应用经典测量理论与项目反应理论对慢性胃炎患者生命质量量表QLICD-CG(V2.0)的条目进行分析。方法 采用QLICD-CG(V2.0)量表,对163名慢性胃炎患者进行生命质量评估。利用Multilog 7.03软件进行项目反应理论分析得出每个条目的难度、区分度系数和信息量,同时结合经典测量理论分析的4种统计方法来评价条目质量的优劣。结果 CTT结果显示,除了3个条目(GPH3、GPS3、CG11)外,剩余条目都符合4种统计学方法至少满足3种的标准;IRT结果显示,所有条目的难度系数都在-6.42~4.36,而且随着难度等级(B1→B4)增加呈现出单调递增的趋势,所有条目的区分度都在1.37~1.69,所有条目的平均信息量都在0.356~0.780。39个条目中,37个条目的性能良好,2个条目(GPH3、GPS3)需要优化。结论 QLICD-CG(V2.0)量表的大部分条目的性能较好,但少数条目仍需进一步改进。  相似文献   

9.
目的 运用项目反应理论(IRT)对慢性病患者生命质量测定量表共性模块(QLICD-GM)条目进行分析,筛选信息量较高条目.方法 应用QLICD-GM测评7种慢性病患者620例,采用塞姆吉玛等级反应模型计算每个条目的难度、区分度系数和信息量,绘制项目特征曲线;根据平均信息量筛选条目;采用MULTILOG 7.0软件进行计算和作图.结果 QLICD-GM共性模块29个条目的区分度均为1.2~1.9;难度(程度)均呈严格单调递增,取值范围为-3.05 ~2.18;依据平均信息量,结合条目特征筛选保留24个条目.结论 QLICD-GM各条目区分度均较好、选项设置合理、难度合适,分析模型选择正确;项目反应理论可筛选出信息量较高条目,弥补经典测量理论(CTT)的不足.  相似文献   

10.
目的 运用经典测量理论(CTT)和项目反应理论(IRT)对药物成瘾生命质量测定量表QLICD-DA(V2.0)的条目进行进一步分析。方法 采用QLICD-DA(V2.0)对192名药物成瘾患者进行调查,利用IRT中的Samejima模型计算每个条目的平均信息量、区分度和难度系数,并结合CTT中的克朗巴赫法、变异度法、相关系数法和因子分析法四种统计方法对条目进行分析。结果 在IRT分析中,除了条目GPH1、GPH2、GPH3、GPH4、GPH5、GPH9,其余条目平均信息量都大于0.11,区分度0.79~2.30,难度系数都在-5.07~3.38,且随难度等级(B1→B4)增加而单调递增;在CTT分析中一共有28条目均满足3种及以上的统计方法要求,结合CTT和IRT共选出39个条目。结论 QLICD-DA(V2.0)的大部分条目性能良好,但仍有部分条目需要进一步评价和修订。  相似文献   

11.
目的 编制毒品成瘾多维心理因素评估量表,并检验其心理测量特性。方法 在半结构化访谈、文献调研的基础上,从风险因素和保护因素两方面入手,并基于个体心理和社会心理两系统确立最常见的11个维度,构建毒品成瘾多维心理因素评估初始量表,通过两次修订形成最终量表。随后对316名吸毒者进行正式量表测试。用经典测量理论(classical test theory,CTT)和项目反应理论(item response theory,IRT)的拓展分部评分模型(generalized partial credit model,GPCM)的方法对量表进行项目质量分析,采用R语言、Mplus 7.0和SPSS 21.0进行数据分析。结果 正式量表包括64个条目,4个分量表和11个因子。量表的Cronbach α系数为0.95,重测信度为0.65。验证性因素分析的结果表明量表具有良好的结构效度。最终在CTT框架下量表的项目区分度在0.40~0.84之间,难度在0.28~0.68之间,IRT框架下量表的项目区分度在0.40~5.18之间,项目难度参数在-1.06~2.70之间。结论 该量表符合心理测量学要求,可以作为吸毒人员成瘾的评估工具。  相似文献   

12.
Background This study investigates the usefulness of the nonparametric monotone homogeneity model for evaluating and constructing Health-Related Quality-of-Life Scales consisting of polytomous items, and compares it to the often-used parametric graded response model. Methods The nonparametric monotone homogeneity model is a general model of which all known parametric models for polytomous items are special cases. Merits, drawbacks, and possibilities of nonparametric and parametric models and available software are discussed. Particular attention is given to the monotone homogeneity model (also known as the Mokken model), and the often-used parametric graded response model. Results Data from the WHOQOL-Bref were analyzed using both the monotone homogeneity model and the graded response model. The monotone homogeneity model analysis yielded unidimensional scales for each content domain. Scalability coefficients further showed that some items have limited scalability with respect to the other items in the same scale. The parametric IRT analyses lead to the rejection of some of the items. Conclusions The nonparametric monotone homogeneity model is highly suited for data analysis in a health-related quality-of-life context, and the parametric graded response model may add interesting features to measurement provided the model fits the data well.  相似文献   

13.
In measuring outcomes of health care, information is obtained from subjects employing instruments that often use Likert scales. These instruments are typically designed using classical testing theory which assumes the errors around the true scores are normally distributed and constant. Advances in psychometric practices through the use of item response theory (IRT) models have led to more flexibility in scale development and in data analyses. In this paper, we introduce statisticians and health services researchers to IRT models through a case-study of data collected to measure subjective distress. The data consist of self-reports of symptom and problem difficulty obtained from a sample of 2,656 patients discharged with a psychiatric disorder from 13 hospitals in the United States between May 2001 and April 2002. Dimensionality of the trait is assessed using principal factor analysis. Model assessment is made using χ2 statistics and residual analyses. We select items for the scale using the Fisher Information available at selected levels of the underlying trait.  相似文献   

14.
Objective  To develop a psychometrically appropriate brief symptoms measure of carpal tunnel syndrome (CTS). Methods  Preoperative CTS 11-item symptom severity and 8-item functional status scales from 693 patients (71% women) with CTS were subjected to exploratory factor analysis and item response theory (IRT) analysis yielding a revised CTS symptoms scale. A validation sample of 213 patients (68% women) with CTS completed the 11-item disabilities of the arm, shoulder and hand (QuickDASH), and the revised symptoms scale and 116 patients also completed the original CTS symptom severity scale (median interval 11 days). Results  Of the 11 CTS symptom severity scale items, 2 items that on factor analysis associated with the functional status items were removed. After IRT recalibrations of the remaining symptom severity scale items, 2 non-fitting items were removed and 2 items were merged creating the 6-item CTS symptoms scale. Factor analysis showed one dominant factor explaining 58% of the variance. Reliability was high (Cronbach alpha = 0.86; IRT person separation reliability = 0.88). No item displayed significant differential item functioning. The 6-item CTS symptoms scale showed strong correlation with the QuickDASH (r = 0.70) and agreement with the original symptom severity scale (ICC = 0.80). Conclusion  The 6-item CTS symptoms scale has good reliability and validity and can be used to measure symptom severity and treatment outcome in CTS.  相似文献   

15.
16.
Background

Health outcomes researchers are increasingly applying Item Response Theory (IRT) methods to questionnaire development, evaluation, and refinement efforts.

Objective

To provide a brief overview of IRT, to review some of the critical issues associated with IRT applications, and to demonstrate the basic features of IRT with an example.

Methods

Example data come from 6,504 adolescent respondents in the National Longitudinal Study of Adolescent Health public use data set who completed to the 19-item Feelings Scale for depression. The sample was split into a development and validation sample. Scale items were calibrated in the development sample with the Graded Response Model and the results were used to construct a 10-item short form. The short form was evaluated in the validation sample by examining the correspondence between IRT scores from the short form and the original, and by comparing the proportion of respondents identified as depressed according to the original and short form observed cut scores.

Results

The 19 items varied in their discrimination (slope parameter range: .86–2.66), and item location parameters reflected a considerable range of depression (−.72–3.39). However, the item set is most discriminating at higher levels of depression. In the validation sample IRT scores generated from the short and long forms were correlated at .96 and the average difference in these scores was −.01. In addition, nearly 90% of the sample was classified identically as at risk or not at risk for depression using observed score cut points from the short and long forms.

Conclusions

When used appropriately, IRT can be a powerful tool for questionnaire development, evaluation, and refinement, resulting in precise, valid, and relatively brief instruments that minimize response burden.

  相似文献   

17.
目的 研制老年人社会支持行为量表(the social support behaviors scale,SSB-31)的简化版,并对其进行评价。方法通过整群随机抽样的方法抽取东莞市1 130名符合纳入标准的老年人进行一对一访问调查,随机抽取565名被调查者作为训练样本,利用经典测量理论和项目反应理论对老年人社会支持行为量表(SSB-31)进行简化版量表的研制,剩余565名被调查者作为考核样本,评价简化版量表的心理测量学特性。结果 经训练样本分析,最终建议或指导维度保留6个条目,情感支持维度保留5个条目,社会化维度保留3个条目,实际援助维度保留7个条目,形成21个条目的老年人社会支持行为量表简化版(SSB-21)。考核样本结果显示,SSB-21的Cronbach α系数为0.958,各维度Cronbachα系数在0.871~0.911之间;验证性因子分析模型拟合显示卡方自由度为4.212,比较拟合指数为0.934,增值适配指数为0.934,拟合优度指数为0.877,非标准适配指标为0.924,渐进残差均方和平方根为0.075,残差均方和平方根为0.039;项目反应理论结果显示,区分度在2...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号