首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。  相似文献   

2.
目的将相对权重指标扩展应用于logistic回归分析,以更精确评价自变量的相对重要性。方法原始变量通过最小二乘正交变换获得一组独立不相关但与原变量最大相关的新变量集,并对因变量关于新变量集作回归分析获取一组标准回归系数β,再通过分析正交变量对原变量的回归作用返回至原变量集获取一组相关系数λ,最后对这两组估计参数平方乘积和所得结果就是自变量成比例贡献于因变量的重要性。结果相对权重总和等于模型的总变异R2,有效地分配了每个自变量对因变量的贡献大小。结论当存在共线性问题时,相对权重是评价自变量相对重要性的精确量化指标,为许多分类资料分析中希望确定自变量相对重要性的研究者提供一个可行的估计方法 。  相似文献   

3.
目的 结合早期胃癌患者淋巴结转移临床预测模型的实例,探讨通过Stata软件建立、评价和验证二分类结局的临床预测模型的实现方法。方法 选取2010年至2018年收集的早期胃癌患者淋巴结转移数据为实例数据集,并以2017年7月1日作为患者入组分界点,将数据分为建模集和验证集,通过实例介绍利用Stata/SE 15.0建立、评价和验证二分类结局临床预测模型的方法。结果 实例中建模集746例胃癌患者中144例(19.3%)发生淋巴结转移。预测模型最终纳入T分期、肿瘤最大径、分化程度和脉管浸润4个变量。模型的区分度评价指标C指数为0.864,模型校准度Hosmer-Lemeshow检验P=0.983,临床决策曲线显示临床适用度较好。在验证集中,模型的C指数为0.911,校准度Hosmer-Lemeshow检验的P值为0.631。结论 利用Stata软件可以简单、快捷地实现临床预测模型的建立、评价和验证过程,尤其在列线图的绘制方面存在优势。  相似文献   

4.
目的探讨当logitπ与连续型自变量之间呈线性关系时,采用原始值法和中位数截断法拟合logistic回归模型的差异。方法以成组设计病例对照研究为背景产生模拟数据,应用R软件"Smei Par"软件包对logitπ与连续型自变量间函数关系进行判断,进而采用原始值法和中位数截断法分别拟合logistic回归模型。结果原始值法较中位数截断法能够更好地拟合logistic回归模型。结论当logitπ与连续型自变量间呈线性关系时,建议采用原始值法。  相似文献   

5.
离散变量包括有序和无序两类资料。无序离散变量的各类之间对致病的反应不存在明确的顺序关系。而有序离散变量则与致病反应有明显顺序关系。目前进入logistic回归模型中的这类资料主要采用两种方法数量化。  相似文献   

6.
解释变量非正交时logistic回归系数的估计   总被引:5,自引:1,他引:4  
目的;研究解释变量非正交时,logistic回归模型参数的估计。方法:引用线性回归系数主成分估计的思想,提出主成分改进的logistic回归系数的加权最小二乘估计。结果:改进的方法能克服多元共线性引起的一般回归系数加权最小二乘估计方差扩大现象,估计值优于一般加权最小二乘估计。结论:用主成分改进的加权最小二乘估计为基础来筛选变量,从而避免变量间共线关系对变量选择的影响。  相似文献   

7.
目的 logistic回归是生物医学研究中常用的方法,可以进行影响因素筛选、概率预测、分类等。高通量测序技术得到的数据给高维变量选择问题带来挑战。惩罚logistic回归可以对高维数据进行变量选择和系数估计,且其有效的算法保证了计算的可行性。方法本文介绍了常用的惩罚logistic算法如LASSO(least absolutes shrinkage and selection operator)、EN(elastic net)、SCAD(smoothly clipped absolute deviation)、MCP(minimax concave penalty)以及SIS(sure independence screening)等,并用模拟数据对各方法进行评价。结果 (1)各方法的结果与自变量间的相关程度有关,不同惩罚logistic回归的精确性与自变量间的相关程度有关,如果相关较高,LASSO或EN的结果较好,而在相关较低时,MCP或SCAD结果较好;(2)结合SIS的方法倾向于少选变量,误选率低,但敏感度也低,而LASSO、MCP、SCAD选择变量较多,误选率高,但敏感度较高;(3)当自变量间低度相关时,SIS的三种方法结果非常接近,但相关较高时,SIS+LASSO的结果表现较好。结论采用非小细胞型肺癌的基因数据集进行实例分析,并表明如何根据模拟实验的结论,在多种方法的不同结果间进行选择。  相似文献   

8.
多元线性回归中自变量共线性的处理张新民,沈杰,俞顺章在流行病生态学研究中,经常应用多元回归分析方法研究多个因素与某个因素的线性依存关系,但在应用过程中常常因为自变量存在共线性,即自变量彼此相关而使回归研究要么求不出回归系数,要么回归系数不稳定。为此,...  相似文献   

9.
配对二分类变量间的差异的区间估计   总被引:1,自引:0,他引:1  
在医学科研中 ,人们常用假设检验的方法判断两总体是否存在差异。但是有时候人们不仅是想了解“有无差异” ,而且还想了解“差异的大小” ,这时区间估计就能满足人们的这个要求。本文介绍了配对设计的二分类变量间差异的可信区间的Quesenberry -Hurst估计方法 (Q -H法 ) ,它在新法 (如新疗法、新诊断方法 )的研究中有一定的使用价值。方法介绍〔1〕若配对设计的二分类资料的结果如下 :方法 1方法 2频数阳性阳性a阳性阴性b阴性阳性c阴性阴性d合计n  方法 1的阳性率为P1=(a b) /n ;方法 2的阳性率为P2 =(a …  相似文献   

10.
logistic回归中高杠杆点的检测   总被引:5,自引:0,他引:5  
本文主要研究了logistic回归中高杠杆点的检测方法,指出了传统用hii检测高杠杆点的不合理性,建议用h*i=hi/(pi(1-pi))作为检测高杠杆点的统计量,并在此基础上提出{(h*i,epi)}图用于检测高杠杆点和异常点。本文还通过Monte-Carlo方法说明了{(h*i,epi)}图不但能检测出高杠杆点和异常点,还可区分高杠杆点的“有害”与“无害”  相似文献   

11.
线性回归模型中自变量相对重要性的衡量   总被引:1,自引:0,他引:1  
线性回归模型在实际应用中经常用到,通常研究者需要在多个自变量中分析哪个自变量对y的影响大,哪个对y的影响小,即对自变量的相对重要性进行衡量。在实际工作中,标准化的回归系数、t统计量或P值等是常用的指标。偏回归系数、相关系数及其平方、半偏相关系数及其平方、偏回归平方和等指标都与自变量的相对重要性有关。Dalington〔1〕认为,如果目的是探索影响因素,偏回归系数是衡量影响力较好的  相似文献   

12.
在社会调查中经常会遇到需要加权的情况,加权通常有以下几种类型[1]:①第一阶段比率调整加权;②不同选择概率加权;③无回答加权;④后分层加权.  相似文献   

13.
双生子研究中二分结局变量的统计分析方法   总被引:1,自引:0,他引:1       下载免费PDF全文
用来分析双生子样本中二分结局变量 (如是否患某病或是否具有某种性状 )的方法很多。传统的方法包括同病率(concordancerates)法和配对优势比 (matchedpairoddsratios)法。前者主要是用来确定遗传因素对疾病发展的影响 ;后者则是以同卵双生子同胞作为对照 ,检验环境暴露对疾病的作用。这两种方法计算简单 ,容易解释 ,但也有不尽人意之处。同病率法的结果受人群中基础患病率的影响很大 ,且无法利用两个都未患病的双生子对的信息 ,也不能利用测量到的环境指标 ;而配对比值比法无法评价遗传因素对疾病的…  相似文献   

14.
Logistic回归模型中自变量相对重要性的优势分析   总被引:1,自引:0,他引:1  
目的应用扩展优势分析方法于Logistic回归模型中,为研究者在确定模型中自变量相对重要性提供一种可选择的方法。方法通过计算和比较与某自变量有关的所有可能子模型(即含有该变量的不同组合)的平均贡献增量△R2,以评价该自变量的相对重要性,并应用于实例分析。结果优势分析所得的各变量的总平均贡献之和等于最终模型的决定系数,其重要性排序与标准回归系数的排序不同,且R2M和R2E更适合作为优势分析的指标。结论优势分析可将各自变量对因变量总方差的贡献,分解为已解释方差百分比,且独立于模型,能精确地衡量自变量的相对重要性。  相似文献   

15.
探讨非独立离散型结局数据的logistic回归模型的基本原理和建模策略。采用SAS PROC GLIMMIX语句对农村中学生二手烟暴露情况及其影响因素研究实例进行两水平logistic回归模型拟合。在控制了组水平(班级)层级因素后,开展了控烟活动的班级二手烟暴露率较低(t=3.27,P=0.004 8);母亲学历越低、父亲吸烟越严重,学生二手烟暴露率越高(分别为t=3.53,P=0.000 4;t=6.51,P<0.000 1)。多层logistic回归模型可以较好地拟合非独立离散型结局数据。  相似文献   

16.
目的针对二分类结果变量,探索II/III期无缝设计的效应估计。方法期中分析选择疗效最优的一个试验组进入二阶段,考虑早期无效终止,研究试验进入二阶段条件下的疗效无偏估计。本文基于二分类资料推导出疗效的一致最小方差无偏估计法,并比较该法与极大似然估计法及二阶段估计法的偏性和均方误差。结果就偏性而言,二阶段估计法最小,极大似然估计法最大,一致最小方差无偏估计法稍高于二阶段估计法;就均方误差而言,极大似然估计法最小,二阶段估计法最大,一致最小方差无偏估计法稍高于极大似然估计法。结论针对二分类资料,一致最小方差无偏估计法的偏性及均方误差相对较小,在可接受范围内,故推荐该法作为二分类资料无缝设计的效应估计方法。  相似文献   

17.
logistic回归模型中交互作用的分析及评价   总被引:4,自引:14,他引:4  
流行病学病因学研究常运用logistic回归模型分析影响因素的作用,并利用纳入乘积项的方法分析因素间交互作用,如有统计学意义表示两因素间存在相乘交互作用,但乘积项若无统计学意义并不表示两因素问相加交互作用或生物学交互作用的有无.文中介绍Rothman提出的针对logistic或Cox回归模型的三个评价相加交互作用的指标及其可信区间的计算,并以SPSS 15.0软件应用实例分析得出logistic回归模型的参数估计值和协方差矩阵,引入Andersson等编制的Excel计算表,计算相加交瓦作用指标及其可信区间,用于评价因素间的相加交互作用,为研究人员分析生物学交互作用提供依据.该方法方便快捷,且Excel计算表可在线免费下载.  相似文献   

18.
<正>在流行病学研究中,经常会遇到结果变量是非连续的分类资料,这时常选用Logistic回归模型来分析各影响因素和结果变量之间的关系。研究者除了通过回归方程来预测外更关心的是哪些因素对结果有影响并解释其影响程度如何,同时把评估各因  相似文献   

19.
目的针对一般研究者在使用Cox回归时,直接比较标准化偏回归系数大小的做法,提出借助Wald检验进行排序,并用小细胞肺癌患者随访研究的实例加以说明。方法借鉴SNK多重比较法的比较策略,以尽可能少的比较次数,使用Wald检验对样本标准化回归系数进行假设检验,从而探讨总体标准化回归系数之间的关系,形成依影响大小排序的若干子集。结果选入模型的4个变量被划分在2个子集内,可认为第1子集中的自变量(实例中的肿瘤大小、年龄)对预后的影响小于第2子集中的自变量(神经元特异性烯醇化酶),自变量癌胚抗原对预后的影响介于两个子集之间。结论基于Wald检验对自变量进行排序,能够克服cox回归模型结果报告中判断自变量影响大小的主观性。  相似文献   

20.
logistic回归应用中容易忽视的几个问题   总被引:9,自引:0,他引:9       下载免费PDF全文
logistic回归在流行病学研究中应用十分广泛,在病例对照研究和队列研究中,logistic回归是经常用到的多变量统计分析方法,在随访研究和横断面调查中,logistic回归的应用也较为普遍。与多元线性回归相比,logistic回归具有许多独特的优点,如对正态性和方差齐性不做要求,对自变  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号