首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
偏最小二乘回归的原理及应用   总被引:8,自引:0,他引:8  
[目的]探讨偏最小二乘回归的理论及其应用。[方法]应用医学实例计算,对偏最小二乘回归与主成分回归及一般最小二乘回归进行比较。[结果]偏最小二乘回归对数据的拟合度优于主成分回归和一般最小二乘回归法。[结论]偏最小二乘回归适用于处理有多重共线性的资料,当解释变量个数多、样本量少时尤为有效,是稳健的数据“软”建模的统计方法。  相似文献   

2.
目的研究用于处理解释变量与反应变量之间非线性关系或复杂关系的一种基于核函数的回归方法:核偏最小二乘回归。方法运用Monte-Carlo模拟方法,对核偏最小二乘回归的模型拟合效果和预测效果予以分析。结果模拟试验结果表明:核偏最小二乘回归估计性能均较高。结论核偏最小二乘回归是基于核函数的非线性回归方法,模型构建基于样本,而非解释变量空间,该方法特别适合于处理医学研究中各种类型资料,能够有效地处理解释变量与反应变量之间的非线性关系或复杂关系等方面。  相似文献   

3.
目的探讨某省高校科技人员类型的影响因素,建立偏最小二乘回归模型,对高校科技人员类型进行预测、判别,为今后高校科技人员的培养及其合理使用提供更加可靠、科学的理论依据。方法采用自编调查量表——高校科技人员影响因素调查表对该省内高校科技人员进行随机抽样调查,采用Chronbachsα系数和因子分析对量表的信度和效度进行检验,运用SAS9.1对收集的数据进行偏最小二乘回归分析。结果 Chronbachsα系数=0.781,表明调查表具有较好的内在一致性信度,因子分析结果显示量表同时具有较高的结构效度。偏最小二乘回归结果显示,该模型具有较好的拟合优度,并符合专业上的解释,可为人事、科研和教育部门进一步完善高校科技人员培养机制提供理论参考依据。结论偏最小二乘回归模型作为一种新兴的统计分析方法适合应用于高校科技人员类型预测的研究。  相似文献   

4.
目的探讨偏最小二乘回归模型在某省高校科技人员人格特征研究中的应用,为今后该省高校科技人员的培养及其合理使用提供更加可靠、科学的理论参考依据。方法选用五因素人格量表(NE0-PI-R)对某省八所高校的114名科技人员进行调查,并对量表进行简化,利用偏最小二乘回归方法进行分析。结果偏最小二乘回归模型具有较好的拟合优度,明确了各条目和人格特征之间的关系,符合专业上的解释,可为人事、科研和教育部门进一步完善高校科技人员培养机制提供理论参考。结论偏最小二乘回归方法作为一种新兴的统计分析方法适用于人格特征的研究。  相似文献   

5.
目的 运用SAS程序实现对偏最小二乘自变量回归系数的假设检验.方法 运用Bootstrap向后筛选变量的方法,用误差均方和评价检验前后模型的预测能力,借助SAS中的PROC SURVEYSELECT、PROC PLS等实现假设检验.结果 在模拟实验中,通过一轮向后筛选变量的过程剔除了两个设定为无统计学意义的自变量,而保存了其余有统计学意义的自变量;在实例中,利用本文的方法和程序也得到了较为满意的结果.结论 Bootstrap向后筛选变量法可以有效地对偏最小二乘回归自变量进行统计学检验,且可以通过SAS方便的实现.  相似文献   

6.
偏最小二乘回归的离群点检测方法   总被引:2,自引:2,他引:2  
目的本文研究了偏最小二乘回归中四种重要且常用的离群点检测图示方法:偏F检验、残差图与正态分位数图、主成份图(T/T图)与T2椭圆、样本点贡献图.方法通过实例分析了各种方法的优点和不足.结果离群点的检测与分离将有助于模型拟合精度和预测精度的提高.结论研究表明必须综合运用这些方法,并结合原始数据,才能取得比较好的检测效果.  相似文献   

7.
目的由于疾病,特别是肿瘤的识别模型,其分型准确度对疾病的治疗和预后具有重要意义,因而,本研究探讨了基于基因表达谱的疾病分型识别模型建模方法。方法结合白血病基因表达谱数据分析,利用偏最小二乘判别分析(PLS-DA)对利用基因微阵列数据予以建立白血病分型模型,并与Golub等提出的建模方法相对照,比较它们的判别效果。结果基于偏最小二乘判别分析的白血病识别模型的拟合准确度和预测准确度均达到100%。结论研究表明,基于偏最小二乘判别分析的模型明显提高了白血病的分型正确率,无论是拟合精度,还是预测精度,均高于Golub等提出的方法。  相似文献   

8.
利用偏最小二乘回归拟合耐药性结核病的总耐药率   总被引:1,自引:0,他引:1  
[目的]探索偏最小二乘回归在结核病生态学研究中的应用,拟合耐药性结核病总耐药率的生态学预测模型。[方法]利用WHO第四次全球耐药结核病监测报告,将偏最小二乘回归和Bootstrap抽样相结合,对回归系数进行检验。[结果]最终得到的偏最小二乘回归方程为^Y=5.521+0.030X1+0.003X7+0.099X9-0.008X15+0.116X18。[结论]在结核病生态学研究中,利用偏最小二乘回归和Bootstrap回归系数假设检验相结合的向后筛选法,可以拟合耐药性结核病总耐药率。  相似文献   

9.
目的探索核正交偏最小二乘方法的特点及其在代谢组学数据分析中的应用。方法通过模拟实验和真实代谢组学数据,评价核正交偏最小二乘方法的模型预测能力及其可视化效果。结果模拟数据分析表明,当数据间存在线性关系时,KOPLS与传统的线性OPLS具有相同的效果;当数据间存在非线性关系时,KOPLS具有相对更高的预测能力,得分图的可视化效果更好。实际数据分析结果显示,应用KOPLS能够提高模型预测能力和改善可视化效果。结论对于高维非线性关系的代谢组学数据更适合使用KOPLS方法。  相似文献   

10.
影响血糖水平因素的偏最小二乘回归分析   总被引:2,自引:0,他引:2  
偏最小二乘(partial least squares,PLS)回归分析方法是近年来应实际需要而产生和发展的一种具有广泛适用性的多元统计分析方法,它集多元线性回归分析、典型相关分析和主成分分析的基本功能于一体,将建模预测类型的数据分析方法与非模式的数据认识性分析方法有机地结合在一起,该方法能够在自变量存在严重多重相关性的条件下进行回归建模,更易于分析与因变量相关的因素,使自变量的回归系数更容易解释.  相似文献   

11.
武海滨  张涛  赵发林  李康 《中国卫生统计》2013,30(4):517-520,524
目的探讨基于偏最小二乘线性判别分析的遗传算法特征筛选性能,并将其应用于高维代谢组学数据。方法通过模拟试验验证基于偏最小二乘线性判别分析的遗传算法特征筛选能力,同时应用于卵巢良恶性肿瘤鉴别的代谢组学数据特征筛选分析。结果模拟实验显示,基于偏最小二乘线性判别分析的遗传算法对信息变量的筛选能力明显优于偏最小二乘变量投影重要性指标;代谢组学数据分析显示,使用遗传算法筛选出的变量能够获得更低的误差率,该方法筛得的变量具有更大的概率包含了与某种生物学结果相关的代谢物。结论基于偏最小二乘线性判别分析的遗传算法作为一种优化技术,在小样本条件下对高维数据的特征筛选具有较好的效果。  相似文献   

12.
目的探讨非线性回归的线性化拟合技术,改善线性化技术对非线性回归的拟合效果。方法通过设立适当的权重,采用加权最小二乘法对非线性回归的线性化方程进行拟合。结果在讨论非线性模型与相应的直线化模型误差间关系的基础上,导出了利用线性化方程进行加权最小二乘估计的权重,使得利用加权最小二乘估计得到的模型参数的估计误差近似于直接对非线性模型进行估计得到的估计误差,建立了非线性回归的加权线性化拟合技术。结论非线性回归的加权线性化拟合技术能较好地改善线性化技术对非线性回归的估计效果。  相似文献   

13.
最小二乘法是预测方法的一种。预测分定性预测和定量预测。定性预测是依靠预测者的主观判断,预测未来发展趋势的方法。它虽有很多优点,但客观依据不足,预测的精度,完全取决于预测者的知识和  相似文献   

14.
目的 采用偏最小二乘通径模型,分析社区卫生服务机构病人满意度及其各个维度之间的关系.方法 使用本土化后的皇家澳大利亚全科医生学会(RAC GP)“全科医学病人满意度监测工具”,在北京市的两家社区卫生服务中心进行满意度调查.对调查所得数据采用偏最小二乘通径模型建模.结果 根据有关理论设计结构模型1,显示硬件设施感知对技术水平感知、技术水平感知对总体满意度的通径系数较小,且没有通过检验.删去两项关系后,重新建立结构模型2.模型2外部载荷系数都达到0.8以上,总体满意度、技术水平感知和病人知情感知的测量系数分别为0.41、0.89、0.80,模型中各项关系也都得到合理解释.其中人际方面感知和病人知情感知是影响总体满意度的主要因素.结论 偏最小二乘通径模型是分析全科医学中病人满意度及其各维度间关系的有效方法,改善医患交流和加强病人知情教育是提高病人满意度的重点.  相似文献   

15.
偏最小二乘法降维在微阵列数据判别分析中的应用   总被引:2,自引:2,他引:2  
目的探讨微阵列数据的判别分析方法。方法首先采用偏最小二乘法对高维数据降维,然后再用Fisher’s线性判别。文中同时介绍了偏最小二乘法的基本原理、基本算法,讨论了成分数选择等问题,并以实际微阵列数据展示了其效果。结果偏最小二乘法降维不但实现了数据的可视化,而且取得了较好的后期判别效果。结论偏最小二乘法是一种新的实用的降维方法,可用于微阵列数据判别分析的前期降维。  相似文献   

16.
目的基于偏最小二乘模型(PLS)提出一种新的FDR估计方法,并对其准确性进行验证。方法利用偏最小二乘的vip评分筛选变量,结合permutation方法和后退法对筛选结果进行FDR估计。结果模拟实验表明,在变量之间独立时,PLS-FDR方法和三种单变量估计方法都能准确估计FDR;在变量之间存在线性关系时,PLS-FDR方法估计FDR仍然具有无偏性,而三种单变量分析方法则无法准确地进行估计。实例分析表明,PLS-FDR方法对高维数据分析能够提供重要信息。结论在线性数据结构下,使用本文给出的PLS-FDR方法能够得出多变量FDR估计结果。  相似文献   

17.
基于LMS回归的一步M估计与加权最小二乘估计   总被引:1,自引:0,他引:1  
探讨在GM假设条件不满足情况下对线性回归模型的稳健估计方法。方法:介绍了估计的稳健性尺度和有效性的概念,采用基于LMS估计的M估计及加权最小二乘估计做稳健回归。结果:通过对一个模拟数据的分析,说明这两种稳健估计结果均优于经典的M估计及LS估计。结论:本文介绍的两种估计方法同时具有较高的稳健性及有效性,并可作近似的稳健推断。  相似文献   

18.
目的探讨相对最小二乘法在理化检验中的应用。方法举例说明相对最小二乘法计算的直线回归方程回归分析的标准系列的最低浓度理论值与测量值的相对差值总和与最小二乘法的区别。结果相对最小二乘法计算的直线回归方程回归分析的标准系列的最低浓度理论值与测量值的相对差值总和均小于最小二乘法。结论建议在理化分析中用相对最小二乘法替换最小二乘法计算直线回归方程式绘制标准曲线代表标准系列计算被测物质含量。  相似文献   

19.
logistic回归模型共线性三种降维方法的模拟比较研究   总被引:2,自引:0,他引:2  
目的 logistic回归模型中解释变量存在共线性的情形下,比较联合式偏最小二乘logistic回归(IPLSLR),耦合式偏最小二乘logistic回归(CPLSLR)和主成分logistic回归(PCLR)三种降维方法所得到的回归系数估计的偏差和稳定性。方法运用MonteCarlo随机法,采用SAS软件编程,模拟估算不同共线性情形下三种降维方法所得到的回归系数估计均值及标准差。结果简单共线性情形下,IPLSLR与CPLSLR回归系数估计的偏差较小,PCLR估计则相对稳定。多重共线性情形下,当样本量较大时,若共线性较高,IPLSLR,CPLSLR和PCLR均获得偏差较小、稳定性较好的回归系数估计;若共线性较低,PCLR回归系数估计的偏差明显大于IPLSLR和CPLSLR。当样本量较小时,IPLSLR与CPLSLR在回归系数估计偏差和稳定性方面互有优劣。结论应根据共线性的程度和样本量的大小决定使用相应的降维方法用于处理logistic回归模型中共线性情况。通过对三种降维方法不足的分析,提出了进一步改进的原则。  相似文献   

20.
目的 应用广义估计方程和准最小二乘方法分析社区卫生服务中心纵向数据,探讨纵向数据分析的问题,为社区的随访的纵向数据的分析提供科学的方法. 方法 对收集的社区卫生服务中心的糖尿病病人血糖的纵向数据,分别使用广义估计方程和准最小二乘方法以及传统的线性回归模型进行分析并比较结果.同时比较三种方法的标准化残差图. 结果 广义估计方程不收敛时与传统线性模型的结果相同,显示糖尿病人血糖与教育水平相关,而广义估计方程收敛时与准最小二乘的结果相同,显示教育无统计学意义.从标准化残差图看广义估计方程和准最小二乘法对数据的拟合比传统回归好. 结论 广义估计方程和准最小二乘法都能有效的处理纵向数据.与广义估计方程相比,准最小二乘法有一些优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号