期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

金水高《中华预防医学杂志》2003,37(3)

logistic回归是研究当因变量为二分变量时,因变量与自变量关系的常用方法,自20世纪80年代初引入国内后,随着计算机技术的发展,统计软件的日益成熟而得到了十分广泛的应用. 相似文献

2.

张波代鲁燕黄启风沈其君《中国卫生统计》2012,29(2):191-192,195

目的将相对权重指标扩展应用于logistic回归分析,以更精确评价自变量的相对重要性。方法原始变量通过最小二乘正交变换获得一组独立不相关但与原变量最大相关的新变量集,并对因变量关于新变量集作回归分析获取一组标准回归系数β,再通过分析正交变量对原变量的回归作用返回至原变量集获取一组相关系数λ,最后对这两组估计参数平方乘积和所得结果就是自变量成比例贡献于因变量的重要性。结果相对权重总和等于模型的总变异R2,有效地分配了每个自变量对因变量的贡献大小。结论当存在共线性问题时,相对权重是评价自变量相对重要性的精确量化指标,为许多分类资料分析中希望确定自变量相对重要性的研究者提供一个可行的估计方法。相似文献

3.

惩罚logistic回归方法在SNPs数据变量筛选研究中的应用

刘匆提李昂门志红姜博肖纯刘艳李贞子《实用预防医学》2016,23(11):1395-1399

目的比较L1正则化、L2正则化和弹性网三种惩罚logistic回归对SNPs数据的变量筛选能力。方法根据所设置的参数生成不同条件的SNPs仿真数据,利用正确率、错误率和正确指数从三个方面评价三种惩罚logistic回归的变量筛选能力。结果正确率表现为L2正则化惩罚logistic回归＞弹性网惩罚logistic回归＞L1正则化惩罚logistic回归;错误率表现为L2正则化惩罚logistic回归＞弹性网惩罚logistic回归＞L1正则化惩罚logistic回归;正确指数则表现为弹性网惩罚logistic回归＞L1正则化惩罚logistic回归＞L2正则化惩罚logistic回归。结论综合来看弹性网的筛选能力更优,弹性网融合L1、L2两种正则化的思想,在高维数据分析中既能保证模型的稀疏性,便于结果的解释,又解决了具有相关性自变量不能同时进入模型的问题。相似文献

4.

线性模型中自变量相对重要性估计方法研究进展

代鲁燕《浙江预防医学》2012,24(2):20-22,37

<正>线性回归分析有2个主要任务:一是建立线性回归方程,用自变量预测因变量;二是分析和解释各自变量对因变量的作用和意义。对各自变量相对重要性估计,分析和解释自变量对因变量的作用和意义是线性回归分析的首要任务,它在医学、生物相似文献

5.

logistic回归中连续型自变量离散化为二分类变量时适宜分界点的确定北大核心CSCD

何贤英赵志温兴煊公为洁黄波张晋昕《中国卫生统计》2015,(2):275-277

目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。相似文献

6.

logistic回归中连续型自变量离散化为二分类变量时适宜分界点的确定

《中国卫生统计》2015,(2)

目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。相似文献

7.

偏相关系数和偏回归系数的统计解析与意义 总被引：1，自引：0，他引：1

陈心广余松林《中国卫生统计》1996,13(6):12-14

本研究提出了一个解析在多元线性回归时每一个自变量与因变量之间的关系的偏相关与偏回归系数的方法，包括系数的估计和每一个自变量与因变量之间的散点图的绘制。使我们能够在多元的情况下也能象一元回归一样，作出变量间关系的散点图，从而达到深入了解回归分析结果的可靠性和协助进行回归诊断的目的。相似文献

8.

单参数指数模型在医药数据分析中的应用研究

何春莫志良《中国卫生统计》2011,28(4)

对于因变量Y是0-1变量,当自变量xi是连续型变量的情况,logistic回归模型长期被应用,来解决这类问题,随着非参数和半参数模型的发展以及计算机编程水平的提高,我们可以用非参数模型或者半参数模型来解决这类问题.非参数模型或者半参数模型可以直接建立Y与xi之间的关系,这种关系的函数的具体的表达式未知,但是,我们可以通过计算机软件得出这个函数的估计值,得到预测模型,对于给定的值就可求出预测值.如果这种方法计算的结果与logistic回归模型预测的结果一致,或者比logistic回归模型预测的结果好,可提供一种新的解决因变量Y是0-1变量,xi是连续型变量的关系模型,这种关系模型比logistic回归模型好,能表示出Y与置的直接的函数关系.本文的单参数指数模型就是半参数模型中的一种,目的是说明单参数指数模型的可行性和优越性. 相似文献

9.

SPSS中的分类树模型在分析伤害影响因素中的应用

杜琳刘伟佳刘伟林汉生麦锦城何秀芳张维蔚林国桢《中国卫生统计》2010,27(5)

目前,国内对于伤害影响因素的研究多采用logistic回归分析.虽然logistic回归模型的理论基础和建模方法都比较成熟,但仍有不足.例如,它对自变量的主效应分析充分,但对变量间的交互作用分析困难;注重自变量对结果影响的数量关系而轻视变量间的层次关系.分类树模型分析能较好的处理变量间的交互作用,并且可分析出各变量的具体影响人群,同时还可提示具有何种特征的人群更易发生伤害,从而可集中资源对伤害发生重点人群进行干预. 相似文献

10.

Logistic回归模型中自变量相对重要性的优势分析 总被引：1，自引：0，他引：1

张波代鲁燕黄启风沈其君《浙江预防医学》2012,24(8):13-15,29

目的应用扩展优势分析方法于Logistic回归模型中,为研究者在确定模型中自变量相对重要性提供一种可选择的方法。方法通过计算和比较与某自变量有关的所有可能子模型(即含有该变量的不同组合)的平均贡献增量△R2,以评价该自变量的相对重要性,并应用于实例分析。结果优势分析所得的各变量的总平均贡献之和等于最终模型的决定系数,其重要性排序与标准回归系数的排序不同,且R2M和R2E更适合作为优势分析的指标。结论优势分析可将各自变量对因变量总方差的贡献,分解为已解释方差百分比,且独立于模型,能精确地衡量自变量的相对重要性。相似文献

11.

主成分logistic回归在筛选妊娠期糖尿病危险因素中的应用 总被引：1，自引：0，他引：1

王丹潘晓平《现代预防医学》2008,35(5):826-827,830

[目的]探讨主成分logistic回归分析方法在筛选妊娠期糖尿病危险因素中的作用.[方法]首先对logistic回归模型进行共线性诊断,然后应用主成分改进的logistic回归分析,得到并解释最终的回归模型.[结果]共线性诊断BMI在内的多种因素有关.[结论]主成分改进的logistic回归在筛选妊娠期糖尿病危险因素中具有较好的作用,在对疾病危险因素进行logistic回归分析时,若变量间存在多重共线性,采用主成分改进的logistic回归分析能得出更合理的回归分析. 相似文献

12.

惩罚logistic回归用于高维变量选择的模拟评价

《中国卫生统计》2016,(4)

目的 logistic回归是生物医学研究中常用的方法,可以进行影响因素筛选、概率预测、分类等。高通量测序技术得到的数据给高维变量选择问题带来挑战。惩罚logistic回归可以对高维数据进行变量选择和系数估计,且其有效的算法保证了计算的可行性。方法本文介绍了常用的惩罚logistic算法如LASSO(least absolutes shrinkage and selection operator)、EN(elastic net)、SCAD(smoothly clipped absolute deviation)、MCP(minimax concave penalty)以及SIS(sure independence screening)等,并用模拟数据对各方法进行评价。结果 (1)各方法的结果与自变量间的相关程度有关,不同惩罚logistic回归的精确性与自变量间的相关程度有关,如果相关较高,LASSO或EN的结果较好,而在相关较低时,MCP或SCAD结果较好;(2)结合SIS的方法倾向于少选变量,误选率低,但敏感度也低,而LASSO、MCP、SCAD选择变量较多,误选率高,但敏感度较高;(3)当自变量间低度相关时,SIS的三种方法结果非常接近,但相关较高时,SIS+LASSO的结果表现较好。结论采用非小细胞型肺癌的基因数据集进行实例分析,并表明如何根据模拟实验的结论,在多种方法的不同结果间进行选择。相似文献

13.

多水平分析在调查问卷结果分析中的应用

《中国卫生统计》2016,(3)

目的探讨应用两水平分层logistic回归模型分析调查问卷二分类结局变量资料的影响因素,对影响因素做出正确的评价和解释。方法以学生的调查问卷作为分析对象,运用两水平分层logistic回归模型,拟合一系列零模型、随机截距模型,识别学生水平和学校水平因素的影响大小。结果学生对所研究问题的看法受到学生个体特征和学校特征的影响,学生层面中学生成绩影响较大。结论多水平分析方法是处理分层嵌套数据的有用工具,利用两水平分层logistic回归模型可以同时探讨学生层面和学校层面解释变量对结局变量的效应,对于分析嵌套数据结构资料结局变量的影响因素有优越性。相似文献

14.

多水平分析在调查问卷结果分析中的应用北大核心CSCD

杨芳丽何佳《中国卫生统计》2016,(3):435-438

目的探讨应用两水平分层logistic回归模型分析调查问卷二分类结局变量资料的影响因素,对影响因素做出正确的评价和解释。方法以学生的调查问卷作为分析对象,运用两水平分层logistic回归模型,拟合一系列零模型、随机截距模型,识别学生水平和学校水平因素的影响大小。结果学生对所研究问题的看法受到学生个体特征和学校特征的影响,学生层面中学生成绩影响较大。结论多水平分析方法是处理分层嵌套数据的有用工具,利用两水平分层logistic回归模型可以同时探讨学生层面和学校层面解释变量对结局变量的效应,对于分析嵌套数据结构资料结局变量的影响因素有优越性。相似文献

15.

关联规则分析和logistic模型的相关性研究

《中国卫生统计》2017,(5)

<正>logistic回归模型是一个经典的统计学模型~[1],利用该模型可以做预测并解释因变量和自变量之间的关系,其已被广泛应用于医学、生物学、工程、经济和农业等领域~([2-6])。关联规则分析是一种数据挖掘方法~[7],它通过人为给出规则标准的方式解释数据库中项与项之间的关系。这两种方法都可以用于提取影响某变量(结局)的因素~([8-10])。目前很多研究利用这两种方法互相补充来获得影响因素~([11-15]),但他们并不解释两种相似文献

16.

住院日影响因素的logistic回归分析

《现代医院管理》2017,(5):46-49

目的探讨住院日的影响因素,为缩短平均住院日提供参考。方法使用SPSS 22.0对因变量住院日进行描述性分析,对自变量分别作单因素logistic回归分析,对单因素分析有意义的自变量进行多因素logistic回归分析。结果住院日大于50 d病人平均住院日80.39 d,住院日小于50 d病人平均住院日9.18 d;单因素logistic回归分析出性别、年龄、入院途径、住院病房、诊断个数、手术个数、离院方式、医疗付费方式、住院费用有统计学意义(P<0.05);多因素logistic回归分析出性别、年龄、住院病房、手术个数、离院方式、医疗付费方式、有统计学意义(P<0.05),住院费用、住院病房、手术个数是前三位的影响因素。结论医院应该合理控制住院费用,缩短肿瘤科病房住院天数,减少非基本医疗保险付费等危险因素,以减少平均住院日。相似文献

17.

复杂抽样数据的logistic回归分析方法及其应用

缪凡童峰《中国卫生统计》2008,25(6)

目的探讨抽样权重在复杂抽样数据logistic回归分析中的重要性。方法采用SAS中PROC LOGIS-TIC和PROC SURVEYLOGISTIC语句对数据进行统计分析,并对结果进行比较。结果在未考虑和考虑抽样权重的lo-gistic回归模型拟合结果中,自变量的偏回归系数和OR值大小及其可信区间都有所不同。结论在logistic模型拟合中,纳入调查数据的抽样权重进行统计分析,从而能更加准确地进行统计推断。相似文献

18.

倾向指数分层法的模拟研究

孟维静王素珍吕军城石福艳《中国卫生统计》2012,29(4):542-543,545

目的用SAS程序模拟研究倾向指数分层法处理非随机化试验数据的效果。方法利用蒙特-卡罗模拟法产生有三个协变量的两组随机样本,以分组变量为因变量,以协变量为自变量建立logistic回归模型,并计算研究对象的倾向指数,然后按照倾向指数分成五层,得到一层内各个协变量均衡的处理组与对照组样本。结果协变量间不均衡的两个处理组在分层以后组内得到了均衡。结论倾向指数法是一种有效处理非随机化试验数据的方法,具有重要的应用价值。相似文献

19.

多水平logistic回归模型在血吸虫病流行因素研究中的优越性

杨建洲赵正元文师吾谭红专《中国卫生统计》2012,29(4):504-506

目的探讨在血吸虫病流行因素的研究中多水平logistic回归模型相对于传统logistic回归模型的优越性。方法分别使用多水平logistic回归模型和传统logistic回归模型分析血吸虫病流行因素。结果多水平logistic回归模型分析中有统计学意义的变量在传统logistic回归分析中均有统计学意义,但在传统logistic回归分析中有意义的几个变量,如人均收入、无害化厕所比例,却没有进入多水平logistic回归模型方程。结论与传统logistic回归模型相比,多水平模型更适合用来研究不同层次的血吸虫病的流行因素。相似文献

20.

医学研究中logistic回归模型的正确应用（一） 总被引：6，自引：0，他引：6

方积乾陈和年《中国卫生统计》1993,10(4):54-57

logistic回归模型现已广泛应用于医学领域，计算机软件也甚普遍。随之而来，应用不当乃至错用亦属常见。本文拟从模型的来龙去脉、相对机会比的计算、方法的选用和参数的统计推断等几个方面阐述其在医学研究中正确应用的根据，并指出常见错误之处。相似文献