首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
偏最小二乘回归及其应用   总被引:21,自引:1,他引:20  
蒋红卫  夏结来 《医学争鸣》2003,24(3):280-283
目的:研究用于多重共线性严重,尤其解释变量个数多、样本量少数据资料的一种新的稳健统计分析方法:偏最小二乘(partial least square,PLS).方法:采用实证方式比较PLS与一般最小二乘(ordinary least square,OLS)逐步回归的优劣.结果:实例分析表明,PLS对数据的拟合度和预测精度均优于另一个常用于处理多重共线性的统计方法:OLS逐步回归.结论:PLS是一种数据“软”建模的稳健统计方法.它无需剔除任何解释变量或样本点,具有简单稳健、易于定性解释、预测精度较高等优点,通常用于数据探索性分析,或处理多重共线性严重资料,尤其当解释变量个数宏、样本量小时很有效;其缺点主要是无法对解释变量与反应变量之间的关系作出精确的定量解释.  相似文献   

2.
目的探讨使用主成分分析处理Logistic回归中共线性问题的方法及其在医学科研中的应用。方法采用多重线性回归中的共线性诊断方法诊断Logistic回归模型的共线性,使用主成分分析处理Logistic回归中的共线性问题,全部计算采用SAS软件。结果在216例高血压脑出血患者的预后影响因素分析中,使用主成分改进的Logistic回归,各估计系数的标准误均有所减小,提示模型结构较为稳定,其结果的可靠性更高。结论使用主成分改进的Logistic回归进行多重共线性的诊断和处理是有效及可行的。  相似文献   

3.
目的探讨在涉及多自变量的Logistic回归分析中变量间多重共线性的诊断和处理方法.方法应用主成分改进的Logistic回归方法进行多重共线性变量的诊断与处理. 结果去除了回归模型中变量间的多重共线性影响,建立了较为理想的关系模型. 结论在Logistic回归模型分析中应用上述方法进行多重共线性的诊断和处理是有效及可行的.  相似文献   

4.
提出了一种基于高斯过程(GP)和偏最小二乘法(PLS)的非线性PLS方法(GP-PLS),以更加有效地处理过程非线性、多输入和数据共线性等复杂特性,提高模型的推广能力和精度。该方法首先采用PLS进行特征提取,再用GP建立PLS的内部模型,因而具有GP与PLS的优点。对工业丙烯腈生产过程丙烯腈收率软测量建模的应用表明,采用该方法建立的软测量模型在模型精度、推广能力等方面明显优于一些传统软测量建模方法,满足工业现场应用要求。  相似文献   

5.
介绍了核函数方法的基本原理及两种核函数统计建模方法;提出了用核函数PLS与核函数PCR建立工业丙烯腈生产过程丙烯腈收率软测量模型,以便更有效地处理过程非线性、多输入和数据共线性等复杂特性。对比研究发现,基于核函数方法的软测量模型要优于线性统计模型,而核函数PLS模型性能优于核函数PCR。  相似文献   

6.
介绍医学研究中适用的几种诊断Logistic回归模型共线性的方法,并进行拟合分析,结果表明,诊断方法确能有效发现自变量观察矩阵之间的多重共线性,便于医学研究者正确合理地建立Logistic回归模型,提高结果的可靠性。  相似文献   

7.
对多因子疾病如高血压、恶性肿瘤等的病因研究以及临床研究,目前多采用诸如线性回归、logistic回归、COX回归等模型进行危险因素的筛选;当变量间线性关系不成立时,选用线性回归模型显然不适宜;选用加入交互作用项或采用变量变换的logistic回归、COX回归等模型,此时交互作用项往往与危险因素存在共线性;而这些分析方法的一个共同缺陷是无法处理变量之间的共线性,  相似文献   

8.
本文讨论了多重共线性对回归分析的最小二乘估计的几种主要影响,并分析了其影响的原因;通过对儿童生长发育资料的应用,介轺了可克服多重共线性影响的回归系统的有偏估计方法。  相似文献   

9.
张丕德  李河 《循证医学》2005,5(6):354-355
在医学研究中,有关多因素的统计学问题是最为普遍的.而多重共线性是涉及回归分析的所有统计学方法都会遇到的问题。所谓多重共线性是指:当多个随机变量之间存在高度线性相关时.它们彼此之间可以相互线性表达:在数量上可以用一个线性方程来表示,在几何图形上表现为多个变量的分布呈几乎重叠在一起的一条直线。多重共线性往往会给统计结果的解释带来困难.  相似文献   

10.
本文介绍了多元分析中自变量之间复共线性的含义、其对回归的系数最小二乘估计的影响及其检测方法;以及复共线资料的统计分析途径:主成份回归、岭回归及岭判别分析。  相似文献   

11.
在总结现有各种软测量技术的基础上,指出统计分析方法中的部分最小二乘法和神经网络方法中的径向基函数网络,是经实际应用证明有效的方法。提出了一种将PLS和RBFN结合的方法,并将PLS,RBFN,PLS-RBFN3种算法分别用于加氢裂化分馏塔航煤点软测量模型的建立,其泛化结果表明基于PL-SRBFN算法建立的软测量模型具有更好的预测精度。  相似文献   

12.
产品的最终质量主要是由生产过程中的关键变量决定的,因此,回归模型的质量预测能力与过程变量的选择密切相关。本文提出了一种新的基于关键变量(CV)的OPLS预测方法(CV-OPLS),用于输出变量较多过程的质量预测。首先,根据关键变量选取准则,为每个质量变量选取建模所需的关键过程变量。为了减少最后需要建立的模型个数,将由质量变量及其相应的关键过程变量组成的数据阵进行重组,并用OSC算法去除重组后的数据阵中与质量变量无关的干扰信息。然后,对校正后的数据阵建立PLS模型,求取相应的模型回归系数,得到最终的质量预测结果。与传统的PLS及OPLS方法相比,该方法能够在保证模型较好预测精度的前提下,有效地简化模型结构。最后,通过Tennessee Eastman(TE)过程的实验仿真验证了CV-OPLS方法的有效性。  相似文献   

13.
杨浩  江华  孙明伟  陈伟  蔡斌  彭谨  周志远  曾俊 《四川医学》2011,32(4):449-452
目的采用汶川大地震后一组伤员救治医疗数据,以偏最小二乘(partial least square,PLS)算法为核心,探讨影响因素并构建一种新的大规模突发公共卫生事件创伤救治预后预测模型。方法以四川省医学科学院.四川省人民医院2008年5月收治的地震伤员数据库作为建模资料来源作为训练集,建模过程包括成分提取和建立回归方程,模型优度判别采用交叉检验。运算平台采用EXCEL和Matlab软件。结果通过相关性分析得到9个因素的相关性,VIP值得到5个影响结局的重要因素,并建立了大规模突发公共卫生事件创伤救治预后预测模型。结论本研究构建的以PLS算法为基础的模型,能可靠的帮助筛选大规模公共卫生事件中创伤患者预后预测的关键性影响因素以及综合评价指标。  相似文献   

14.
在海量数据背景下,传统的基于单个计算节点的算法很难满足分析要求。考察了一种分布式贝叶斯估计方法,通过在每台机器上单独运行蒙特卡洛抽样并做加权平均可以有效地解决算法效率问题。将该方法应用于基于广义极值模型的二元响应变量回归分析,并探讨其实用性。模拟研究表明分布式算法比传统方法更有效。  相似文献   

15.
分别使用logistic逐步回归法、贝叶斯模型平均法和LASSO回归进行特征变量筛选,分析美国SEER数据库的预后数据,探讨影响结直肠癌预后的相关因素,并应用人工神经网络分类算法构建预后模型,指导结直肠癌预后评价。结果证明,贝叶斯模型平均法结合人工神经网络的混合算法所构建的预后模型准确率最高。  相似文献   

16.
目的 为咬痕分析提供正常人前牙及前牙弓参数的依据.方法 随机抽取成都地区健康青壮年100例,采用扫描牙颌模型overlay技术-计算机辅助测量对咬痕相关的前牙区各形态学参数进行测量统计,运用偏最小二乘法(partial least squares,PLS)分析上下颌模型数据.结果 获得正常人前牙(牙切嵴厚度、牙切嵴宽度、牙切嵴面积及牙角度)和前牙弓(牙弓宽度、牙弓高度、牙弓角度、牙间角度)参数数据;PLS法分析模型中距离类参数预测误差值低于0.1.结论 在咬痕比对分析中只有尽可能多的找到特征点,才能提供较准确的判定结果.利用PLS法不仅可分析牙颌模型,还可对咬痕鉴定提供依据.  相似文献   

17.
目的探讨血栓弹力图(TEG)在预测腔隙性脑梗死(LS)发展为进展性脑梗死(PLS)中的作用。方法选取LS病人142例,根据是否发展为PLS分为PLS组(46例)与无进展性腔隙性脑梗死组(Non-PLS组)(96例)。采用TEG5000型分析仪检测最大振幅、凝固角、凝固时间与反应时间等TEG参数。结果PLS组最大振幅、凝固角明显大于Non-PLS组,凝固时间、反应时间明显短于Non-PLS组(P < 0.01)。Pearson直线相关分析显示,最大振幅、凝固角与PLS病人NHISS评分呈正相关(P < 0.05),凝固时间、反应时间与PLS病人NHISS评分呈负相关(P < 0.01)。logistic回归分析显示,最大振幅、凝固角可作为LS发展为PLS的独立危险因素,凝固时间、反应时间可作为LS发展为PLS的独立保护因素(P < 0.05~P < 0.01)。结论TEG在预测LS发展为PLS中的作用显著,其中最大振幅、凝固角越大,凝固时间、反应时间越短则预测LS发展为PLS的风险越大。  相似文献   

18.
目的:采用偏最小二乘法探讨亚健康状态的判识模型。方法:采用偏最小二乘法进行建模、预测,对亚健康状态进行判别,统计判别的准确率;在逐步回归变量筛选后再次进行预测,观察判别准确率的变化情况。结果:基于偏最小二乘法建立的亚健康判识模型对亚健康状态的预测准确率为89.47%,经变量筛选后,预测准确率提高至92.10%。结论:偏最小二乘法在亚健康状态的模型判别中具有较高的准确性,在亚健康建模的研究中有一定的参考价值。基于变量筛选后预测准确率的变化,从量表优化的角度来看,偏最小二乘法也可以为变量的精简提供一定的依据。  相似文献   

19.
赵清波  徐勇勇 《医学争鸣》1998,19(3):254-256
目的:建立一个较优的logistic回归方程,探讨logistic回归方程自变量的变换问题。方法;利用图示方法和Monte-carlo方法讨论了loigistic回归中自变量的变换问题。结果:对原有图示方法进行了改进,提出了一种新的图示方法-普通偏残差图,并用实例说明了其医学应用价值。结论:普通偏残差图不仅简单,而且能较准确地提示自变量的变换形式。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号