首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 808 毫秒
1.
目的 应用经典测量理论(classical test theory, CTT)和项目反应理论(item response theory, IRT)对慢性肺源性心脏病生命质量测定量表[QLICD-CPHD(V2.0)]进行条目分析与评价。方法 采用QLICD-CPHD(V2.0)量表对184名慢性肺源性心脏病患者进行调查,运用经典测量理论中的相关系数法、变异度法、因子分析法、克朗巴赫系数法对QLICD-CPHD(V2.0)量表的条目进行分析评定,同时运用项目反应理论中的Samejima等级反应模型计算量表每个条目的难度、信息量和区分度系数。结果 CTT结果提示存在7个条目不满足至少3种的统计学要求,其中共性模块6个,特异模块1个。IRT结果显示条目区分度范围为1.18~1.44较为适宜。难度系数随难度等级(B1→B4)增加而单调递增,存在部分条目难度系数b超过标准值范围。各条目平均信息量分布在0.185~0.576。结论 经CTT与IRT分析,QLICD-CPHD(V2.0)量表的大部分条目质量较高,具有较好的区分度,但仍有少量条目需进一步分析和修订。  相似文献   

2.
目的 运用经典测量理论与项目反应理论对消化性溃疡患者生命质量量表QLICD-PU(V2.0)的条目进行分析与评价,为量表的改进与完善提供依据。方法 应用QLICD-PU(V2.0)对170例消化性溃疡患者进行测评,采用经典测量理论中的变异度法、相关系数法、因子分析法、克朗巴赫系数法,同时应用项目反应理论中的Samejima等级反应模型计算每个条目的难度、区分度系数和信息量,来评价QLICD-PU(V2.0)量表条目的质量。结果 经典测量理论结果提示QLICD-PU(V2.0)共性模块中变异法计算在总的41个条目中条目标准差小于0.90的有7个; 在总的41个条目中有9个条目与其所在领域的相关性比较低; 项目反应理论结果显示所有条目的区分度较好,取值范围均在1.01~1.69; 在总的41个条目中33个条目的难度系数取值范围在-3.94~3.70,且随着难度等级(B1→B4)的增加呈现出单调递增的趋势; 共性模块条目的平均信息量均较好,特异模块的平均信息量不太理想。结论 QLICD-PU(V2.0)量表所有条目区分度,大部分条目的难度以及共性模块平均信息量比较好,量表具较好的信度,但仍然有部分条目有待进一步修订并验证效果。  相似文献   

3.
目的 运用经典测量理论(CTT)和项目反应理论(IRT)对药物成瘾生命质量测定量表QLICD-DA(V2.0)的条目进行进一步分析。方法 采用QLICD-DA(V2.0)对192名药物成瘾患者进行调查,利用IRT中的Samejima模型计算每个条目的平均信息量、区分度和难度系数,并结合CTT中的克朗巴赫法、变异度法、相关系数法和因子分析法四种统计方法对条目进行分析。结果 在IRT分析中,除了条目GPH1、GPH2、GPH3、GPH4、GPH5、GPH9,其余条目平均信息量都大于0.11,区分度0.79~2.30,难度系数都在-5.07~3.38,且随难度等级(B1→B4)增加而单调递增;在CTT分析中一共有28条目均满足3种及以上的统计方法要求,结合CTT和IRT共选出39个条目。结论 QLICD-DA(V2.0)的大部分条目性能良好,但仍有部分条目需要进一步评价和修订。  相似文献   

4.
目的 应用经典测量理论与项目反应理论对慢性胃炎患者生命质量量表QLICD-CG(V2.0)的条目进行分析。方法 采用QLICD-CG(V2.0)量表,对163名慢性胃炎患者进行生命质量评估。利用Multilog 7.03软件进行项目反应理论分析得出每个条目的难度、区分度系数和信息量,同时结合经典测量理论分析的4种统计方法来评价条目质量的优劣。结果 CTT结果显示,除了3个条目(GPH3、GPS3、CG11)外,剩余条目都符合4种统计学方法至少满足3种的标准;IRT结果显示,所有条目的难度系数都在-6.42~4.36,而且随着难度等级(B1→B4)增加呈现出单调递增的趋势,所有条目的区分度都在1.37~1.69,所有条目的平均信息量都在0.356~0.780。39个条目中,37个条目的性能良好,2个条目(GPH3、GPS3)需要优化。结论 QLICD-CG(V2.0)量表的大部分条目的性能较好,但少数条目仍需进一步改进。  相似文献   

5.
目的 运用项目反应理论(IRT)对慢性病患者生命质量测定量表共性模块(QLICD-GM)条目进行分析,筛选信息量较高条目.方法 应用QLICD-GM测评7种慢性病患者620例,采用塞姆吉玛等级反应模型计算每个条目的难度、区分度系数和信息量,绘制项目特征曲线;根据平均信息量筛选条目;采用MULTILOG 7.0软件进行计算和作图.结果 QLICD-GM共性模块29个条目的区分度均为1.2~1.9;难度(程度)均呈严格单调递增,取值范围为-3.05 ~2.18;依据平均信息量,结合条目特征筛选保留24个条目.结论 QLICD-GM各条目区分度均较好、选项设置合理、难度合适,分析模型选择正确;项目反应理论可筛选出信息量较高条目,弥补经典测量理论(CTT)的不足.  相似文献   

6.
目的 利用项目反应理论(item response theory,IRT)对《中国版职业紧张核心量表》质量进行分析与评价,为后期量表使用和修订提供参考依据。方法 采用方便抽样方法,抽取湖北省两家三甲医院和多家一、二级医院共1261名医务人员作为研究对象,应用《中国版职业紧张核心量表》调查其职业紧张情况。采用主成分分析验证量表4个维度的单维性。采用IRT中的Same Jima等级反应模型计算每个条目的区分度、难度系数和信息量,从微观角度评价量表的测量特性。结果 量表4个维度均满足单维性假设。IRT结果显示所有条目的区分度较好,取值范围在0.67~3.10;17个条目中有13个条目的难度系数在-2.78~2.30之间,且不存在难度逆反现象,条目9和11难度过高且难度逆反,条目15和16难度过低过高并存且有难度逆反现象,提示待改进;除了条目9、11和15提供的信息量中等,条目16和17提供的信息量较差以外,其余条目的信息量均较好。结论 《中国版职业紧张核心量表》所有条目的区分度较好。从难度系数和信息量两个角度,条目9、11、15、16、17的测验质量均是有待改进的,其余条目性能良好,建议针对上述分析结果结合专家意见对问题条目进行修订。  相似文献   

7.
目的对MHIEC-COPD测试版量表的条目再次分析和筛选,以便形成正式版量表MHIEC-COPD(V1.0)。方法采用测试版老年COPD患者多维健康测评量表,对451例60岁及以上老年COPD患者进行调查。采用项目反应理论IRT中的塞姆吉玛等级反应模型计算每个条目的难度、区分度系数,并结合经典测量理论CTT的四种统计方法来评价条目。结果除共性模块中4个条目(GPH4、GPH9、GPS1、GSO4)外,其余条目3种CTT统计分析均入选。各条目的区分度均在1.00~1.39,所有条目的难度系数均在-5.12~4.49,且随难度等级(B1→B4)增加单调递增。最后结合专家讨论,从21个条目中选出16个条目组成正式版量表ECMH-COPD(V1.0)。结论按严格的程序选出16个条目质量较高具有较好的代表性,其中共性模块9条,特异模块7条。  相似文献   

8.
目的用经典测量理论(Classical test theory,CTT)分析慢性病患者生命质量测定量表体系共性模块(QLICD-GM)每个条目的难度与区分度。方法调查8种慢性病的1024例患者,采用经典测量理论计算每个条目的难度、区分度系数,采用SPSS软件进行计算和作图。结果共性模块条目难度适中,不是太难也不是太简单。条目的区分度总体适中,但是个别条目区分度过低,比如生理领域的条目PH2、PH6、PH7,需要对条目加以考虑。结论慢性病患者生命质量测定量表体系共性模块具有较好的难度和区分度,可以作为我国慢性病患者生命质量的测评工具,但QLICD-GM(V1.0)的理论结构还有待进一步补充完善。  相似文献   

9.
目的 探讨项目反应理论中的等级反应模型在基于冠心病患者报告临床结局量表(CHD-PRO)条目筛选中的应用.方法 对CHD-PRO初始量表所有条目拟合等级反应模型,依据区分度参数和难度等级参数对条目进行评价和筛选.结果 通过等级反应模型理论对量表条目进行筛选,初始量表共计62个条目,建议删除12个条目.结论 与经典测量理论和传统方法相比,项目反应理论与等级反应模型能够克服等级资料的限制,增加了对受试对象能力的估计,更加适合量表条目的筛选.  相似文献   

10.
目的 编制毒品成瘾多维心理因素评估量表,并检验其心理测量特性。方法 在半结构化访谈、文献调研的基础上,从风险因素和保护因素两方面入手,并基于个体心理和社会心理两系统确立最常见的11个维度,构建毒品成瘾多维心理因素评估初始量表,通过两次修订形成最终量表。随后对316名吸毒者进行正式量表测试。用经典测量理论(classical test theory,CTT)和项目反应理论(item response theory,IRT)的拓展分部评分模型(generalized partial credit model,GPCM)的方法对量表进行项目质量分析,采用R语言、Mplus 7.0和SPSS 21.0进行数据分析。结果 正式量表包括64个条目,4个分量表和11个因子。量表的Cronbach α系数为0.95,重测信度为0.65。验证性因素分析的结果表明量表具有良好的结构效度。最终在CTT框架下量表的项目区分度在0.40~0.84之间,难度在0.28~0.68之间,IRT框架下量表的项目区分度在0.40~5.18之间,项目难度参数在-1.06~2.70之间。结论 该量表符合心理测量学要求,可以作为吸毒人员成瘾的评估工具。  相似文献   

11.
项目反应理论在SF-36心理测量学特征评价中的应用   总被引:1,自引:0,他引:1  
目的使用项目反应理论(item response theory,IRT)对SF-36量表进行分析,探讨更适合于量表分析的方法。方法采用横断面研究。使用SF-36量表调查526例确诊的鼻咽癌患者,使用部分评分模型对反映生理健康的21个条目进行分析:计算PSI(person separation index),估计阈值参数和生存质量,对性别、年龄、婚姻等进行项目功能差异(DIF)分析。结果 PSI=0.85,整个模型的拟合效果好;除了条目3i、3j、8的阈值参数顺序出现颠倒外,其余条目均符合理论假设;DIF分析结果显示,所有的条目都没有非一致性DIF,条目4a在性别上存在一致性DIF,条目3g、10a在病人来源上存在一致性DIF。结论 SF-36生理健康的21个条目基本满足单维性、局部独立性的要求,可以放在一起进行IRT分析。IRT能够克服等级资料的限制,能力参数与阈值参数定义在同一个标尺上,而且存在参数不变性的优点,更加适合量表的分析评价。  相似文献   

12.

Purpose

The present study investigates the properties of the French version of the OUT-PATSAT35 questionnaire, which evaluates the outpatients’ satisfaction with care in oncology using classical analysis (CTT) and item response theory (IRT).

Methods

This cross-sectional multicenter study includes 692 patients who completed the questionnaire at the end of their ambulatory treatment. CTT analyses tested the main psychometric properties (convergent and divergent validity, and internal consistency). IRT analyses were conducted separately for each OUT-PATSAT35 domain (the doctors, the nurses or the radiation therapists and the services/organization) by models from the Rasch family. We examined the fit of the data to the model expectations and tested whether the model assumptions of unidimensionality, monotonicity and local independence were respected.

Results

A total of 605 (87.4 %) respondents were analyzed with a mean age of 64 years (range 29–88). Internal consistency for all scales separately and for the three main domains was good (Cronbach’s α 0.74–0.98). IRT analyses were performed with the partial credit model. No disordered thresholds of polytomous items were found. Each domain showed high reliability but fitted poorly to the Rasch models. Three items in particular, the item about “promptness” in the doctors’ domain and the items about “accessibility” and “environment” in the services/organization domain, presented the highest default of fit. A correct fit of the Rasch model can be obtained by dropping these items. Most of the local dependence concerned items about “information provided” in each domain. A major deviation of unidimensionality was found in the nurses’ domain.

Conclusions

CTT showed good psychometric properties of the OUT-PATSAT35. However, the Rasch analysis revealed some misfitting and redundant items. Taking the above problems into consideration, it could be interesting to refine the questionnaire in a future study.  相似文献   

13.
14.
目的 研制老年人社会支持行为量表(the social support behaviors scale,SSB-31)的简化版,并对其进行评价。方法通过整群随机抽样的方法抽取东莞市1 130名符合纳入标准的老年人进行一对一访问调查,随机抽取565名被调查者作为训练样本,利用经典测量理论和项目反应理论对老年人社会支持行为量表(SSB-31)进行简化版量表的研制,剩余565名被调查者作为考核样本,评价简化版量表的心理测量学特性。结果 经训练样本分析,最终建议或指导维度保留6个条目,情感支持维度保留5个条目,社会化维度保留3个条目,实际援助维度保留7个条目,形成21个条目的老年人社会支持行为量表简化版(SSB-21)。考核样本结果显示,SSB-21的Cronbach α系数为0.958,各维度Cronbachα系数在0.871~0.911之间;验证性因子分析模型拟合显示卡方自由度为4.212,比较拟合指数为0.934,增值适配指数为0.934,拟合优度指数为0.877,非标准适配指标为0.924,渐进残差均方和平方根为0.075,残差均方和平方根为0.039;项目反应理论结果显示,区分度在2...  相似文献   

15.
Context A test score is a number which purportedly reflects a candidate’s proficiency in some clearly defined knowledge or skill domain. A test theory model is necessary to help us better understand the relationship that exists between the observed (or actual) score on an examination and the underlying proficiency in the domain, which is generally unobserved. Common test theory models include classical test theory (CTT) and item response theory (IRT). The widespread use of IRT models over the past several decades attests to their importance in the development and analysis of assessments in medical education. Item response theory models are used for a host of purposes, including item analysis, test form assembly and equating. Although helpful in many circumstances, IRT models make fairly strong assumptions and are mathematically much more complex than CTT models. Consequently, there are instances in which it might be more appropriate to use CTT, especially when common assumptions of IRT cannot be readily met, or in more local settings, such as those that may characterise many medical school examinations. Objectives The objective of this paper is to provide an overview of both CTT and IRT to the practitioner involved in the development and scoring of medical education assessments. Methods The tenets of CCT and IRT are initially described. Then, main uses of both models in test development and psychometric activities are illustrated via several practical examples. Finally, general recommendations pertaining to the use of each model in practice are outlined. Discussion Classical test theory and IRT are widely used to address measurement‐related issues that arise from commonly used assessments in medical education, including multiple‐choice examinations, objective structured clinical examinations, ward ratings and workplace evaluations. The present paper provides an introduction to these models and how they can be applied to answer common assessment questions. Medical Education 2010: 44 : 109–117  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号