期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《中国卫生统计》2015,(2)

目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。相似文献

2.

logistic回归中连续型自变量离散化为二分类变量时适宜分界点的确定北大核心CSCD

何贤英赵志温兴煊公为洁黄波张晋昕《中国卫生统计》2015,(2):275-277

目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。相似文献

3.

双界点OR值最大法logistic回归在中小学生登革热知识提高影响因素研究中的应用

《中国卫生统计》2017,(4)

目的探讨双界点OR值最大法logistic回归在中小学生登革热知识提高幅度的影响因素研究中的应用。方法基于多阶段分层整群随机抽样的广州市中小学生登革热相关知识传播效果的干预研究的调查数据,建立中小学生登革热知识提高幅度影响因素的双界点OR值最大法logistic回归模型,与采用连续型变量法、中位数法、单界点P值最小法的logistic回归模型比较模型拟合效果,探讨双界点OR值最大法logistic回归的优势。结果纳入干预效果评估的共1311人,三年级299名,五年级331名,初二321名,高二360名。以高二数据为例,双界点OR值最大法logistic回归纳入的自变量为知识基线得分、干预方式、登革热病例数;其模型的拟合效果最好,且对于自变量分界点的划分更合理,能够更好地筛选出与结局有关联的影响因素。结论双界点OR值最大法logistic回归适用于中小学生登革热知识提高幅度影响因素的研究。中小学生的登革热知识的干预效果受多个因素的影响,应开展有针对性的健康教育。相似文献

4.

单参数指数模型在医药数据分析中的应用研究

何春莫志良《中国卫生统计》2011,28(4)

对于因变量Y是0-1变量,当自变量xi是连续型变量的情况,logistic回归模型长期被应用,来解决这类问题,随着非参数和半参数模型的发展以及计算机编程水平的提高,我们可以用非参数模型或者半参数模型来解决这类问题.非参数模型或者半参数模型可以直接建立Y与xi之间的关系,这种关系的函数的具体的表达式未知,但是,我们可以通过计算机软件得出这个函数的估计值,得到预测模型,对于给定的值就可求出预测值.如果这种方法计算的结果与logistic回归模型预测的结果一致,或者比logistic回归模型预测的结果好,可提供一种新的解决因变量Y是0-1变量,xi是连续型变量的关系模型,这种关系模型比logistic回归模型好,能表示出Y与置的直接的函数关系.本文的单参数指数模型就是半参数模型中的一种,目的是说明单参数指数模型的可行性和优越性. 相似文献

5.

复杂抽样数据的logistic回归分析方法及其应用

缪凡童峰《中国卫生统计》2008,25(6)

目的探讨抽样权重在复杂抽样数据logistic回归分析中的重要性。方法采用SAS中PROC LOGIS-TIC和PROC SURVEYLOGISTIC语句对数据进行统计分析,并对结果进行比较。结果在未考虑和考虑抽样权重的lo-gistic回归模型拟合结果中,自变量的偏回归系数和OR值大小及其可信区间都有所不同。结论在logistic模型拟合中,纳入调查数据的抽样权重进行统计分析,从而能更加准确地进行统计推断。相似文献

6.

限制性立方样条在非线性回归中的应用研究

罗剑锋金欢李宝月赵耐青《中国卫生统计》2010,27(3)

目的探讨限制性立方样条在自变量和应变量非线性相关时的应用。方法应用限制性立方样条分析泰坦尼克号乘客生存数据,通过LOWESS平滑曲线和AIC值比较限制性立方样条和分段亚元回归的分析效果。结果限制性立方样条结合logistic回归可以较好地拟合自变量和应变量的非线性关系,并能发现重要的关键点。结论限制性立方样条在非线性影响因素分析,特别是剂量效应分析中有比较好的应用前景。相似文献

7.

用于生存资料分析的R软件CutpointsOEHR包

陈逸敏张晋昕《中国卫生统计》2020,(2):307-309

目的介绍R软件CutpointsOEHR包的主要功能及其应用,为广大临床医生和研究者寻找生存数据中连续型自变量的合理分界点提供参考。方法利用美国退伍军人管理局肺癌研究组的肺癌数据,演示用CutpointsOEHR包寻找年龄变量合理分界点的过程与代码。CutpointsOEHR包使用AIC判定准则量化cox模型的拟合效果,并选择合理的双界点使cox模型有最好拟合效果。结果对于与结局风险呈U型关系的连续型自变量,CutpointsOEHR包可方便地计算该自变量的两个合理分界点。结论用R软件CutpointsOEHR包寻找分界点的过程与代码易于解读、具有可操作性,为生存数据cox回归应用中自变量的合理离散化提供实用的操作参考。相似文献

8.

logistic回归参数遗传算法估计的可行性研究

韩芳陈金瓯柳青《中国卫生统计》2012,29(1):74-76

目的考察遗传算法作为logistic回归模型参数估计方法的效能,并与极大似然估计法比较.方法通过数据模拟建立三种模型,分别用遗传算法和极大似然法作参数估计,考察建立模型的分类效能.结果一般情况下,极大似然估计法的分类效能稍高于遗传算法.在样本量较小或自变量关系复杂的情况下,极大似然估计法和遗传算法的泛化误差增加.极大似然估计法的泛化误差主要源于在验证集中分类效能下降,而遗传算法的泛化误差主要源于训练集中的过拟合.当样本量小且自变量关系复杂的情况下,极大似然估计法出现迭代不收敛,参数失拟合,遗传算法无此现象.结论遗传算法适用于自变量多而样本量相对小时logistic回归模型参数估计. 相似文献

9.

logistic回归中两种不同杠杆点诊断方法的初步探讨

《中国卫生统计》2015,(6)

目的探讨logistic回归模型中两种不同杠杆点诊断方法间的异同,为杠杆点诊断及其软件应用提供参考。方法选取分类型和连续型两种协变量数据类型的实例,分别建立logistic回归模型,并采用代表不同估计方法的SPSS与STATA软件对回归模型进行杠杆点诊断。结果两种杠杆点诊断方法在处理不同类型数据时并不完全一致,当模型协变量组数远小于研究对象个体数时,两种方法所得结果有所不同。结论研究者应根据研究目的和资料类型正确选用不同软件进行杠杆点诊断。相似文献

10.

分式多项式模型在流行病学资料分析中的应用

徐英张敏周舒冬《中国卫生统计》2011,28(5)

目的探讨分式多项式模型在流行病学资料分析尤其是处理连续型自变量时的应用.方法通过研究癌症病人特征与病情是否减轻之间的关系的示例分析说明模型的实际应用.结果该模型可以揭示癌症病人特征与病情间复杂非线性关系,且可以得出模型的表达式和常用的联系强度指标比值比的大小.结论分式多项式模型可以有效地处理连续型自变量对结果变量的影响,并能通过灵活多样的方式对结果进行表达. 相似文献

11.

两水平方差成分模型与线性回归模型关系的探讨 总被引：1，自引：1，他引：0

李晓松倪宗瓒《中国卫生统计》1999,16(1):14-16

目的探讨对于具有两个水平层次结构的数据拟合方差成份模型与线性回归模型的关系。方法通过三类传统线性回归模型与两水平方差成份模型参数估计的对比分析其内在联系,结果线性回归模型参数的估计以及估计的稳定性与自变量在水平２单位间和水平２单位内的变异大小有关,线性回归模型与方差成分模型参数估计及其稳定性的关系与水平２残差方差或单位内相关系数大小有关。结论当数据具有层次结构特征时,三类线性回归模型均存在相似文献

12.

logistic回归中自变量相对重要性的相对权重估计

张波代鲁燕黄启风沈其君《中国卫生统计》2012,29(2):191-192,195

目的将相对权重指标扩展应用于logistic回归分析,以更精确评价自变量的相对重要性。方法原始变量通过最小二乘正交变换获得一组独立不相关但与原变量最大相关的新变量集,并对因变量关于新变量集作回归分析获取一组标准回归系数β,再通过分析正交变量对原变量的回归作用返回至原变量集获取一组相关系数λ,最后对这两组估计参数平方乘积和所得结果就是自变量成比例贡献于因变量的重要性。结果相对权重总和等于模型的总变异R2,有效地分配了每个自变量对因变量的贡献大小。结论当存在共线性问题时,相对权重是评价自变量相对重要性的精确量化指标,为许多分类资料分析中希望确定自变量相对重要性的研究者提供一个可行的估计方法。相似文献

13.

多分类有序logit模型资料平行线假设及检验方法 总被引：1，自引：0，他引：1

赵晋芳范月玲曾平曹红艳刘桂芬《中国卫生统计》2009,26(1)

目的介绍多分类有序logit模型资料平行线假设及检验方法.方法对儿童脂肪水平数据的自变量年龄、性别、胸围和瘦素等采用得分检验和Wald检验,以检查是否满足平行线假设.结果得分检验和Wald检验表明胸围和瘦素在不同的脂肪水平间不满足平行线假设.结论一般多分类有序logit模型中,自变量满足平行线假设,在违背假设时需要选用其他更合适的统计模型. 相似文献

14.

群随机研究中倾向性评分匹配与混合效应模型比较

赵航余小金《中华疾病控制杂志》2024,(1):112-116

目的比较倾向性评分匹配(propensity score matching, PSM)法和混合效应模型法在群随机试验中的统计效能,为同类研究的统计分析方法选择提供指导。方法通过模拟研究与急性缺血性脑卒中疗效评级数据,比较倾向性评分后拟合单因素条件logistic回归分析模型和直接拟合混合效应模型应用于含有混杂因素的群随机试验数据时的统计学性能,说明方法应用场景和选择策略。结果 PSM后,各混杂因素组间均衡性明显改善。条件logistic回归分析模型和混合效应模型处理效应估计结果十分接近,但前者的P值更小。实例分析结果显示,匹配后各混杂因素的标准化均数差异(standardized mean difference, SMD)均控制在0.1以内,条件logistic回归分析模型识别出两个研究结局的处理组间差异;而混合效应模型仅识别出7 d有效率的处理组间差异。结论 PSM可以平衡群随机试验中的混杂因素,提高两组间的可比性,其检验效能较高。推荐在临床群随机试验中优先考虑PSM法,但也要注意其应用条件和局限性。相似文献

15.

GAM识别非线性相关及其在医学统计建模中的应用

李宏田袁悦李智文王琳琳刘建蒙《中国卫生统计》2012,29(6):782-785,789

目的介绍广义相加模型(GAM)识别非线性相关及其在医学统计建模中的应用。方法应用SAS软件PROC GAM模块识别实例数据结局变量与自变量之间的非线性相关,通过比较考虑该非线性相关和不考虑该非线性相关时多元线性回归和logistic回归模型的拟合和预测效果,阐明GAM识别非线性相关在统计建模中的重要性。结果与不考虑非线性相关的模型相比,考虑非线性相关的模型拟合和预测效果更优。结论合理使用GAM,在模型中纳入非线性成分,可改善回归模型的建模效果和预测精度。相似文献

16.

惩罚logistic回归用于高维变量选择的模拟评价

《中国卫生统计》2016,(4)

目的 logistic回归是生物医学研究中常用的方法,可以进行影响因素筛选、概率预测、分类等。高通量测序技术得到的数据给高维变量选择问题带来挑战。惩罚logistic回归可以对高维数据进行变量选择和系数估计,且其有效的算法保证了计算的可行性。方法本文介绍了常用的惩罚logistic算法如LASSO(least absolutes shrinkage and selection operator)、EN(elastic net)、SCAD(smoothly clipped absolute deviation)、MCP(minimax concave penalty)以及SIS(sure independence screening)等,并用模拟数据对各方法进行评价。结果 (1)各方法的结果与自变量间的相关程度有关,不同惩罚logistic回归的精确性与自变量间的相关程度有关,如果相关较高,LASSO或EN的结果较好,而在相关较低时,MCP或SCAD结果较好;(2)结合SIS的方法倾向于少选变量,误选率低,但敏感度也低,而LASSO、MCP、SCAD选择变量较多,误选率高,但敏感度较高;(3)当自变量间低度相关时,SIS的三种方法结果非常接近,但相关较高时,SIS+LASSO的结果表现较好。结论采用非小细胞型肺癌的基因数据集进行实例分析,并表明如何根据模拟实验的结论,在多种方法的不同结果间进行选择。相似文献

17.

条件logit模型与嵌套logit模型的比较

郭仲琪张丕德《中国卫生统计》2012,29(3):385-386,388

目的通过条件logit模型与嵌套logit模型的差异,比较两模型对备择项相关的数据的适应性。方法建立条件logit模型和嵌套logit模型,并且根据四种类型的拟合优度指标进行模型比较。结果嵌套logit模型对数据的拟合程度更好。结论在建立嵌套logit模型的过程中,能通过备择项的分类消除各项间的相关性,所以其更适合处理备择项有相关关系的数据。相似文献

18.

重复观测因变量值的直线回归与相关分析 总被引：2，自引：1，他引：1

黄正南《中国卫生统计》1990,(1)

本文推导出有重复观测因变量值的直线相关和回归分析,它适用于按自变量值整理的有因变慢值的频数、均数和标准差的资料。本文还提出一种反映回归直线拟合优度的新的相关系数。相似文献

19.

胃癌危险因素研究中多因子共线性的logistic回归分析 总被引：5，自引：0，他引：5

鞠振宇姜又红肖峰《中国卫生统计》2001,18(3):141-144

目的探索胃癌的危险因素,并探讨研究中存在的多因子共线性的处理方法。方法采用病例对照方法,获得50名胃癌患者和50名对照的流行病学资料;PCR方法检测个体基因型;应用线性回归中的三个工具,对各研究因素进行共线性诊断：用主成分分析改进的方法,得出并解释最终的回归模型。结果多因素logistic回归结果与单因素分析结果不一致,共线性诊断显示方差膨胀因子普遍较大,GSTM1基因型、肿瘤家族史等因素之间存在多因子共线性。应用主成分分析改进后的logistic回归模型拟合数据,不仅各回归系数的标准误均有减小,而且有更多的因素被选入模型。结论遗传易感性和环境因素在胃癌的发生中共同起作用。对疾病危险因素进行logistic回归分析时,应首先进行原始变量的多重共线性诊断,并结合主成分分析得出更合理的回归模型。相似文献

20.

序列相关检验简介

王业英《中国卫生统计》1993,10(6):42-43

回归预测模型的建立必须满足以下三个条件：①因变量与自变量之间存在线性统计关系。②自变量是确定性的，多元线性回归中要求自变量之间不存在线性关系。③各期的随机误差在任何时期都是互不相关的，反之则存在序列相关。只有符合上述三个假定条件时，预测模型才是有效的。在建立线性回归预测模型时，尤其当采用时间序列数据建模预测时，需从多方面对模型的假定条件加以检定，以检查模型是否成立。相似文献