共查询到20条相似文献,搜索用时 46 毫秒
1.
金水高 《中华预防医学杂志》2003,37(3)
logistic回归是研究当因变量为二分变量时,因变量与自变量关系的常用方法,自20世纪80年代初引入国内后,随着计算机技术的发展,统计软件的日益成熟而得到了十分广泛的应用. 相似文献
2.
目的将相对权重指标扩展应用于logistic回归分析,以更精确评价自变量的相对重要性。方法原始变量通过最小二乘正交变换获得一组独立不相关但与原变量最大相关的新变量集,并对因变量关于新变量集作回归分析获取一组标准回归系数β,再通过分析正交变量对原变量的回归作用返回至原变量集获取一组相关系数λ,最后对这两组估计参数平方乘积和所得结果就是自变量成比例贡献于因变量的重要性。结果相对权重总和等于模型的总变异R2,有效地分配了每个自变量对因变量的贡献大小。结论当存在共线性问题时,相对权重是评价自变量相对重要性的精确量化指标,为许多分类资料分析中希望确定自变量相对重要性的研究者提供一个可行的估计方法 。 相似文献
3.
目的 比较L1正则化、L2正则化和弹性网三种惩罚logistic回归对SNPs数据的变量筛选能力。 方法 根据所设置的参数生成不同条件的SNPs仿真数据,利用正确率、错误率和正确指数从三个方面评价三种惩罚logistic回归的变量筛选能力。 结果 正确率表现为L2正则化惩罚logistic回归>弹性网惩罚logistic回归>L1正则化惩罚logistic回归;错误率表现为L2正则化惩罚logistic回归>弹性网惩罚logistic回归>L1正则化惩罚logistic回归;正确指数则表现为弹性网惩罚logistic回归>L1正则化惩罚logistic回归>L2正则化惩罚logistic回归。 结论 综合来看弹性网的筛选能力更优,弹性网融合L1、L2两种正则化的思想,在高维数据分析中既能保证模型的稀疏性,便于结果的解释,又解决了具有相关性自变量不能同时进入模型的问题。 相似文献
4.
<正>线性回归分析有2个主要任务:一是建立线性回归方程,用自变量预测因变量;二是分析和解释各自变量对因变量的作用和意义。对各自变量相对重要性估计,分析和解释自变量对因变量的作用和意义是线性回归分析的首要任务,它在医学、生物 相似文献
5.
何贤英赵志温兴煊公为洁黄波张晋昕 《中国卫生统计》2015,(2):275-277
目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。 相似文献
6.
《中国卫生统计》2015,(2)
目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。 相似文献
7.
偏相关系数和偏回归系数的统计解析与意义 总被引:1,自引:0,他引:1
本研究提出了一个解析在多元线性回归时每一个自变量与因变量之间的关系的偏相关与偏回归系数的方法,包括系数的估计和每一个自变量与因变量之间的散点图的绘制。使我们能够在多元的情况下也能象一元回归一样,作出变量间关系的散点图,从而达到深入了解回归分析结果的可靠性和协助进行回归诊断的目的。 相似文献
8.
对于因变量Y是0-1变量,当自变量xi是连续型变量的情况,logistic回归模型长期被应用,来解决这类问题,随着非参数和半参数模型的发展以及计算机编程水平的提高,我们可以用非参数模型或者半参数模型来解决这类问题.非参数模型或者半参数模型可以直接建立Y与xi之间的关系,这种关系的函数的具体的表达式未知,但是,我们可以通过计算机软件得出这个函数的估计值,得到预测模型,对于给定的值就可求出预测值.如果这种方法计算的结果与logistic回归模型预测的结果一致,或者比logistic回归模型预测的结果好,可提供一种新的解决因变量Y是0-1变量,xi是连续型变量的关系模型,这种关系模型比logistic回归模型好,能表示出Y与置的直接的函数关系.本文的单参数指数模型就是半参数模型中的一种,目的是说明单参数指数模型的可行性和优越性. 相似文献
9.
10.
Logistic回归模型中自变量相对重要性的优势分析 总被引:1,自引:0,他引:1
目的应用扩展优势分析方法于Logistic回归模型中,为研究者在确定模型中自变量相对重要性提供一种可选择的方法。方法通过计算和比较与某自变量有关的所有可能子模型(即含有该变量的不同组合)的平均贡献增量△R2,以评价该自变量的相对重要性,并应用于实例分析。结果优势分析所得的各变量的总平均贡献之和等于最终模型的决定系数,其重要性排序与标准回归系数的排序不同,且R2M和R2E更适合作为优势分析的指标。结论优势分析可将各自变量对因变量总方差的贡献,分解为已解释方差百分比,且独立于模型,能精确地衡量自变量的相对重要性。 相似文献
11.
主成分logistic回归在筛选妊娠期糖尿病危险因素中的应用 总被引:1,自引:0,他引:1
[目的]探讨主成分logistic回归分析方法在筛选妊娠期糖尿病危险因素中的作用.[方法]首先对logistic回归模型进行共线性诊断,然后应用主成分改进的logistic回归分析,得到并解释最终的回归模型.[结果]共线性诊断BMI在内的多种因素有关.[结论]主成分改进的logistic回归在筛选妊娠期糖尿病危险因素中具有较好的作用,在对疾病危险因素进行logistic回归分析时,若变量间存在多重共线性,采用主成分改进的logistic回归分析能得出更合理的回归分析. 相似文献
12.
《中国卫生统计》2016,(4)
目的 logistic回归是生物医学研究中常用的方法,可以进行影响因素筛选、概率预测、分类等。高通量测序技术得到的数据给高维变量选择问题带来挑战。惩罚logistic回归可以对高维数据进行变量选择和系数估计,且其有效的算法保证了计算的可行性。方法本文介绍了常用的惩罚logistic算法如LASSO(least absolutes shrinkage and selection operator)、EN(elastic net)、SCAD(smoothly clipped absolute deviation)、MCP(minimax concave penalty)以及SIS(sure independence screening)等,并用模拟数据对各方法进行评价。结果 (1)各方法的结果与自变量间的相关程度有关,不同惩罚logistic回归的精确性与自变量间的相关程度有关,如果相关较高,LASSO或EN的结果较好,而在相关较低时,MCP或SCAD结果较好;(2)结合SIS的方法倾向于少选变量,误选率低,但敏感度也低,而LASSO、MCP、SCAD选择变量较多,误选率高,但敏感度较高;(3)当自变量间低度相关时,SIS的三种方法结果非常接近,但相关较高时,SIS+LASSO的结果表现较好。结论采用非小细胞型肺癌的基因数据集进行实例分析,并表明如何根据模拟实验的结论,在多种方法的不同结果间进行选择。 相似文献
13.
14.
目的探讨应用两水平分层logistic回归模型分析调查问卷二分类结局变量资料的影响因素,对影响因素做出正确的评价和解释。方法以学生的调查问卷作为分析对象,运用两水平分层logistic回归模型,拟合一系列零模型、随机截距模型,识别学生水平和学校水平因素的影响大小。结果学生对所研究问题的看法受到学生个体特征和学校特征的影响,学生层面中学生成绩影响较大。结论多水平分析方法是处理分层嵌套数据的有用工具,利用两水平分层logistic回归模型可以同时探讨学生层面和学校层面解释变量对结局变量的效应,对于分析嵌套数据结构资料结局变量的影响因素有优越性。 相似文献
15.
16.
《现代医院管理》2017,(5):46-49
目的探讨住院日的影响因素,为缩短平均住院日提供参考。方法使用SPSS 22.0对因变量住院日进行描述性分析,对自变量分别作单因素logistic回归分析,对单因素分析有意义的自变量进行多因素logistic回归分析。结果住院日大于50 d病人平均住院日80.39 d,住院日小于50 d病人平均住院日9.18 d;单因素logistic回归分析出性别、年龄、入院途径、住院病房、诊断个数、手术个数、离院方式、医疗付费方式、住院费用有统计学意义(P<0.05);多因素logistic回归分析出性别、年龄、住院病房、手术个数、离院方式、医疗付费方式、有统计学意义(P<0.05),住院费用、住院病房、手术个数是前三位的影响因素。结论医院应该合理控制住院费用,缩短肿瘤科病房住院天数,减少非基本医疗保险付费等危险因素,以减少平均住院日。 相似文献
17.
目的探讨抽样权重在复杂抽样数据logistic回归分析中的重要性。方法采用SAS中PROC LOGIS-TIC和PROC SURVEYLOGISTIC语句对数据进行统计分析,并对结果进行比较。结果在未考虑和考虑抽样权重的lo-gistic回归模型拟合结果中,自变量的偏回归系数和OR值大小及其可信区间都有所不同。结论在logistic模型拟合中,纳入调查数据的抽样权重进行统计分析,从而能更加准确地进行统计推断。 相似文献
18.
19.
目的探讨在血吸虫病流行因素的研究中多水平logistic回归模型相对于传统logistic回归模型的优越性。方法分别使用多水平logistic回归模型和传统logistic回归模型分析血吸虫病流行因素。结果多水平logistic回归模型分析中有统计学意义的变量在传统logistic回归分析中均有统计学意义,但在传统logistic回归分析中有意义的几个变量,如人均收入、无害化厕所比例,却没有进入多水平logistic回归模型方程。结论与传统logistic回归模型相比,多水平模型更适合用来研究不同层次的血吸虫病的流行因素。 相似文献
20.
医学研究中logistic回归模型的正确应用(一) 总被引:6,自引:0,他引:6
logistic回归模型现已广泛应用于医学领域,计算机软件也甚普遍。随之而来,应用不当乃至错用亦属常见。本文拟从模型的来龙去脉、相对机会比的计算、方法的选用和参数的统计推断等几个方面阐述其在医学研究中正确应用的根据,并指出常见错误之处。 相似文献