首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。  相似文献   

2.
logistic回归模型在ROC分析中的应用   总被引:5,自引:0,他引:5  
目的探讨logistic回归模型在有协变量或多指标联合诊断试验ROC分析中的应用。方法根据疾病状态建立logistic回归模型,通过形成的预测概率或联合预测因子为分析指标,并结合非参数模型和双正态模型建立ROC曲线。结果通过实例阐述了整个分析过程,并说明了该试剂盒的有效性,同时利用两种模型得到了一致的结果。结论ROC分析中结合logistic回归模型简单有效,尤其适用于有协变量或多指标联合诊断试验的分析评价。  相似文献   

3.
广义可加模型及其SAS程序实现   总被引:1,自引:0,他引:1  
回归分析中,非参数回归以其适用性强,对模型假定要求不严等优点,扩展了参数回归的应用范围,增强了模型的适应性。但非参数回归也有其局限性,当模型中的解释变量个数较多而样本含量并不是很大时,非参数回归拟合的效果并不尽如人意,容易引起方差的急剧增大。这种由于维度的增加而使方差急剧扩大的问题通常被称为“维度的孽根(curse of dimensionality)。而且非参数回归多是建立在核估计和光滑样条基础上的,其解释性也是一个问题。为了解决这些问题,Stone(1985)提出了可加模型(additive models),这种模型对多变量回归方程估计一个可加近似值。可加近似值有两个优点:(1)由于每一个个体的可加项是以单变量平滑估计的,因而“维度的孽根”可以避免;(2)个体项的估计解释了应变量如何随着自变量的变化而变化的。为了使可加模型扩展到更广范围的分布族,Hastie和Tibshirani(1990)又提出了广义可加模型(generalized additive models,GAM)。  相似文献   

4.
目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。  相似文献   

5.
目的 介绍长期生存者资料生存分析模型与方法 .方法 以SARS病人为例阐述半参数治愈模型原理与方法 ,并将长期生存者资料半参数治愈模型与Cox回归模型得到的结果 进行对比分析.结果 Cox比例风险回归模型得到四个协变量有统计学意义;半参数治愈模型比例风险回归部分得到一个有意义的协变量,logistic回归部分得到三个协变量有统计学意义.结论 在对长期生存者存在的资料分析时,半参数治愈模型比传统的Cox比例风险回归模型更具优势,不仅模型形式简明,参数估计解释合理,而且可从多角度提供更多有价值的信息,是一种适用范围更广,实用性更强的统计分析方法 .  相似文献   

6.
logistic回归是一种常用的统计分析方法,它主要适用于因变量为分类变量的回归分析.按因变量的取值可分为二分类与多分类logistic回归;按研究设计类型可以分为非条件与条件logistic回归,前者用于成组或非配对的研究,后者主要用于配对(匹配)的病例对照研究[1].虽然SAS、SPSS软件等均有logistic回归分析功能,但没有直接进行条件logistic回归分析的模块,需要进行相应的变换后采用其它模型进行分析[2],且分析方法相对难于掌握.另外,采用SAS或SPSS软件进行logistic回归分析后所得到的结果也不直观,需要有一定的统计学基础.  相似文献   

7.
半参数回归模型及模拟实例分析   总被引:1,自引:1,他引:0  
目的 放宽经典线性模型中的解释变量的线性假定和探讨半参数回归分析模型。方法 利用最小惩罚二乘原理构造加权惩罚平方和,通过广义交互有效得分函数自动选择光滑参数值,用直接法求解方程组。结果 用SAS程序实现了半参数回归分析。得到了回归系数向量和样条函数的最小惩罚二乘估计,模拟实例表明,半参数回归模型较传统的线性模型有较强的适应性。结论 半参数回归模型是经典线性模型和非参数回归模型的一个混合体。可作为回归分析的一种新技术得到广泛应用。  相似文献   

8.
目的探讨当logitπ与连续型自变量之间呈线性关系时,采用原始值法和中位数截断法拟合logistic回归模型的差异。方法以成组设计病例对照研究为背景产生模拟数据,应用R软件"Smei Par"软件包对logitπ与连续型自变量间函数关系进行判断,进而采用原始值法和中位数截断法分别拟合logistic回归模型。结果原始值法较中位数截断法能够更好地拟合logistic回归模型。结论当logitπ与连续型自变量间呈线性关系时,建议采用原始值法。  相似文献   

9.
目的探索我国中老年人群中甘油三酸酯葡萄糖指数(Triglyceride Glucose Index, TyG)及其结合肥胖指标与高血压前期的关系,为更好的分级管理高血压前期人群提供辅助措施。方法通过中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS)数据库纳入非高血压人群5 099名;获得体质指数(Body Mass Index, BMI)、腰围(Waist Circumference, WC)和腰围身高比(Waist to Height Ratio, WtHR)等指标。将TyG指数分别与三者相乘计算TyG-BMI、TyG-WC和TyG-WtHR指数。logistic回归分析探讨TyG指数及其结合肥胖指标作为连续型变量与四分位分类变量与高血压前期的关系。使用Delong法对各个指标值(Area Under the Curve, AUC)进行比较以区分其识别高血压前期的价值。结果 logistic回归分析显示,连续型变量TyG、TyG-BMI、TyG-WtHR与高血压前期无显著关联,TyG-WC与高血压前期...  相似文献   

10.
目的用SAS程序模拟研究倾向指数分层法处理非随机化试验数据的效果。方法利用蒙特-卡罗模拟法产生有三个协变量的两组随机样本,以分组变量为因变量,以协变量为自变量建立logistic回归模型,并计算研究对象的倾向指数,然后按照倾向指数分成五层,得到一层内各个协变量均衡的处理组与对照组样本。结果协变量间不均衡的两个处理组在分层以后组内得到了均衡。结论倾向指数法是一种有效处理非随机化试验数据的方法,具有重要的应用价值。  相似文献   

11.
半参数回归模型介绍*第三军医大学(630038)易东王文昌张蔚许汝福回归分析技术是揭示医学和生物学现象中各个因素内在联系的有力工具。半参数回归模型是介于参数回归和非参数回归的一种新的回归分析技术,其研究起源于80年代,并在近几年引起了许多统计学者的关...  相似文献   

12.
人工神经网络在个体患原发性高血压预测中的应用   总被引:1,自引:0,他引:1  
目的 在流行病学调查资料的基础上,探讨并评价预测个体患原发性高血压的新方法.方法 选择8 914例社区居民流行病学调查资料,按3:1分为训练集(6 686例)与检验集(2 228例),分别用于筛选变量、建立预测模型及对模型的检测和评价.应用人工神经网络(ANN)和logistic回归分别建立高血压患病预测模型,用受试者工作曲线(ROC)评价预测模型的优劣.结果 ANN预测模型的灵敏度(95.94%)、特异度(85.04%)、约登指数(80.98%)、一致率(88.78%)优于logistic回归预测模型(灵敏度=51.31%、特异度=95.56%、约登指数=46.87%、一致率=80.39%).通过ROC曲线下面积比较模型的预测能力:ANN预测模型曲线下面积(Az=0.904±0.007)明显大于logistic回归预测模型(Az=0.734±0.012).结论 利用ANN模型进行疾病分类预测,较logistic回归模型能获得更好的预测效果.  相似文献   

13.
提高非线性函数近似回归模型预测精度的探讨   总被引:1,自引:0,他引:1  
常用非线性函数近似回归模型的求法,通常是采用把非线性函数进行变量代换,转化为线性方程后进行线性回归,然后还原为非线性函数,即曲线直线化的回归方法。该方法在变换过程中,会严重影响到一些非线性函数近似回归模型的预测精度,下面分析产生该问题的原因,并给出解决此问题的方法。原理与方法对于n对实测数据{(xi,yi)|i=1,2,…,n},倘若它们之间的函数关系是非线性的,但可以通过变量代换Y=f(y)把它们转化为线性关系,就可以用最小二乘法求出它们的近似回归模型。令S1=Σ(yi-yi)2,据文献〔1…  相似文献   

14.
目的探讨非线性半相依回归模型在医学研究领域中的应用。方法以毒理学试验中对四氯化碳CCl4肝细胞毒性的研究为例,应用非线性回归模型分析CCl4肝细胞毒性剂量-反应关系及其与时间的关系。结果 CCl4浓度及时间对乳脱酸氢酶渗出率的影响有统计学意义,且CCl4浓度与时间之间存在交互作用。结论当生长曲线资料中变量之间的关系不满足线性或近似线性关系时,采用非线性半相依回归模型的参数估计方法可以更好的解决这类问题。  相似文献   

15.
logistic回归是研究当因变量为二分变量时 ,因变量与自变量关系的常用方法 ,自 2 0世纪 80年代初引入国内后 ,随着计算机技术的发展 ,统计软件的日益成熟而得到了十分广泛的应用。但是并不是所有的研究者对于logistic回归的方法都能正确使用 ,对结果都能正确解释。近年来的文献中经常出现对方法错用、误用及对结果的错误解释的现象。下面仅就在使用logistic方法时经常出现的错误进行探讨。一、logistic回归中分类变量的数量化方法在logistic回归中 ,自变量可以有多种形式。以连续变量形式表示的如年龄 ;以等级变量形式进入方程的如不同的污…  相似文献   

16.
目的 探讨分式多项式模型在流行病学资料分析尤其是处理连续型自变量时的应用.方法 通过研究癌症病人特征与病情是否减轻之间的关系的示例分析说明模型的实际应用.结果 该模型可以揭示癌症病人特征与病情间复杂非线性关系,且可以得出模型的表达式和常用的联系强度指标比值比的大小.结论 分式多项式模型可以有效地处理连续型自变量对结果变量的影响,并能通过灵活多样的方式对结果进行表达.  相似文献   

17.
logistic回归是研究当因变量为二分变量时,因变量与自变量关系的常用方法,自20世纪80年代初引入国内后,随着计算机技术的发展,统计软件的日益成熟而得到了十分广泛的应用.  相似文献   

18.
广义可加模型及其SAS程序实现   总被引:1,自引:0,他引:1  
回归分析中,非参数回归以其适用性强,对模型假定要求不严等优点,扩展了参数回归的应用范围,增强了模型的适应性。但非参数回归也有其局限性,当模型中的解释变量个数较多而样本含量并不是很大时,非参数回归拟合的效果并不尽如人意,容易引起方差的急剧增大。这种由于维度的增加而使方差急剧扩大的问题通常被称为“维度的祸害(curse of dimensionality)”。  相似文献   

19.
边际回归模型方法及医学应用   总被引:1,自引:0,他引:1  
目的探讨边际回归模型在医学研究领域多变量相关分析中的应用。方法结合两个医学研究实例,说明边际回归模型原理,软件和实际应用。结果连续型和二分类的多变量需要使用不同的相关测量。对两种类型资料。边际回归模型都可以同时估计回归系数和关联参数。结论边际回归模型方法应用灵活、方便,可作为多变量相关分析的常规工具之一。  相似文献   

20.
神经网络在生存分析中的应用进展   总被引:3,自引:0,他引:3  
生存分析(survival analysis)是研究从起点事件到终点事件所持续时间及其相关影响因素的一类技术方法的总称.有很多模型可用于拟合生存时间与相关变量间的关系,主要有参数、非参数及半参数模型等三大类,每种都各有其缺陷。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号