首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 303 毫秒
1.
目的评价当生存数据出现不同删失比例的条件下,AFT模型和Cox模型的表现优劣。方法采用自编SAS宏程序模拟不同参数设置、不同比例均匀删失的Weibull分布,分别采用AFT模型和Cox模型对模拟产生的数据进行拟合,并从偏倚、准确性和覆盖程度三个指标对两个模型的表现进行评价。结果在分布参数和自变量效应值固定的情况下,AFT模型在参数估计偏倚和准确性两方面的表现却始终优于Cox模型。删失比例越大,AFT模型的表现相对而言越优异。而在覆盖程度方面,对于相同参数设置及删失比例的模拟数据,两个模型的表现相似。结论 AFT模型的总体表现优于Cox模型,当删失生存数据同时满足两类模型的应用条件时,应该优先选择偏倚更小、准确性更高的AFT模型进行分析。  相似文献   

2.
Cox比例风险模型是生存分析中最常用的模型,很多实际问题中的协变量并不满足比例风险,而且协变量的效应可能随时间变化。基于这些情况的考虑,Aalen提出了加法危险率模型,Aalen模型是Cox模型的补充。Aalen模型一个重要的特征就是其回归系数是随时间变化的函数,这种函数没有特定的形式,也不依赖任何参数假定。  相似文献   

3.
目的基于LASSO-Cox模型探索交叉验证(cross validation)、pcvl法(penalized cross-validated log-likelihood)、EBIC准则(extended bayesian information criterion)、平稳选择(stability selection)四种方法在控制FDR(false discovery rate)方面的表现及其变量选择效果。方法通过模拟研究评价各方法在不同删失比例、自变量间不同相关程度以及回归系数的不同稀疏水平下的FDR和PSR(positive select rate),并从GEO上下载DLBCL数据进行基因与预后间的关联分析。结果模拟结果表明,在不同删失比例、自变量相关程度和稀疏水平的情况下,平稳选择法控制FDR的能力都优于其他方法且其变量选择效能也较高。EBIC准则在相关程度低、自变量较稀疏时表现较好,当样本量较小时结果较保守。pcvl法虽然不容易漏掉有效应的变量,但其FDR仍较高。实例结果显示,EBIC准则只选出1个基因,平稳选择法选出的基因中大部分有统计学意义且与其他方法的结果重合度高。结论在基于LASSO-Cox模型的高维数据生存分析中平稳选择法能较好地控制FDR且其变量选择效能也较高。  相似文献   

4.
正删失(censoring)是生存分析时经常会遇到的一个实际问题,为生存数据的处理分析带来了一定困难。针对这一问题,在实际研究中往往需要通过随机模拟来产生含一定删失比例的特定生存分布数据,供探索性研究或对比性研究使用。文献检索后发现,目前国内外针对删失生存数据的模拟研究数量较少~[1-3]。按照其发生是否与研究对象的其他特征有关,删失分为随机删失(random censoring)和非随机删失  相似文献   

5.
覃婷  王彤 《中国卫生统计》2012,29(3):325-329
目的探讨有监督的主成分分析及偏Cox回归模型在基因数据生存预测中的应用。方法针对基因数据的协变量个数大于样本例数,以及变量间存在相关性等特点进行模拟研究,并对国际上公开的三个基因数据集进行分析,考察两种模型的预测性能。结果模拟研究显示随着影响生存的基因块的方差的增大以及组内相关系数的增高,两种方法的预测性能变好;随着删失比例的增加,两种方法的预测性能变差。实例分析提示不同的数据集最适方法不同。结论 SuperPC和偏Cox回归都适用于基因数据的生存分析。在模拟中SuperPC比偏Cox回归的表现好,但偏Cox回归计算速度较快。  相似文献   

6.
多结局Cox模型在医学中的应用和Stata实现   总被引:3,自引:2,他引:1  
目的探讨生存分析中多结局风险比例模型在实际研究中的应用.方法采用多结局的比例风险模型,采用偏似然估计和校正方差估计值,引入新的协变量,同一因素的不同结局的风险函数比(HR)不同.结果通过对实例的分析显示该方法在实际应用中较好地解决了同一因素对应不同结局风险函数比(HR)不同的问题.结论对于不同结局,定义协变量的相应取值,使多结局比例风险模型可估计和推断同一因素对应不同结局的风险函数比.  相似文献   

7.
目的基于倾向性评分匹配(propensity score matching, PSM)的思想设计对无序多分类资料匹配的算法,并开发R语言程序。方法首先运用logistic回归分别计算多个分组水平两两比较的回归系数。用回归系数计算两两组合的组别之间的倾向评分。采用分步流程,先对两组样本量最少的样本进行匹配,之后再用已配成的数据对,在第三组中寻找倾向性评分距离最近的样本。基于以上逻辑过程设计无序三分类资料PSM的算法并编写R语言程序代码,在实际的临床研究数据集上进行测试验证,对匹配前后的数据进行协变量分布不平衡性分析。结果所开发的R程序可顺利运行,能提供稳定可靠的无序三分类资料PSM。在实例数据上,匹配前后协变量的分布不均衡性得到明显降低。结论本研究开发的匹配模算法能有效应用于无序三分组间混杂因素控制。  相似文献   

8.
目前,Cox比例风险回归模型由于较好地解决了随访资料的时间变量分布的多样性和删失数据处理等问题,成为在临床疗效评价和预后因素分析及流行病学队列研究的暴露效应和混杂因素控制分析中常用的多变量统计方法。然而,人们在使用过程中往往忽略了“比例风险”的假定,即风险函数的  相似文献   

9.
介绍借助R软件应用样条Cox回归分析不满足Cox比例风险模型两个基本假定条件的随访资料的方法,可同时估计非线性效应和时协效应.结果表明文中实例涉及的连续型协变量多不符合线性假定,3个变量不符合比例风险假定,应用样条Cox回归控制多个协变量后,踝臂指数每降低0.1,全因死亡的风险比(HR)为1.071.随访资料在不满足比例风险Cox回归模型的应用条件时,可选择应用样条Cox回归进行分析.  相似文献   

10.
目的 介绍生存分析中区间删失数据的特点及含区间删失数据生存函数估计的非参数方法,并介绍其在SAS9.2中的程序实现.方法 采用非参数极大似然估计法对Beadle等研究2种疗法对早期乳腺癌患者形体美容效果研究的区间删失数据进行生存函数估计,并利用SAS中的宏程序%EMICM实现其计算.结果 非参数极大似然估计法有效的计算出了2组疗法患者每个个体的生存概率、死亡概率、累积生存概率以及生存率的标准误,绘制出了2组疗法患者的生存曲线.结论 区间删失数据是临床实践中较常见的一类数据,区间删失数据生存函数估计的非参数方法 是常用的一种方法,但其计算相对右删失数据过程复杂,缺乏相应的软件实现,本文提供的SAS宏程序可以有效的实现计算,为实际工作提供帮助.  相似文献   

11.
目的:探讨Cox模型中某给定连续变量对生存效应的最佳函数形式。方法:不含该变量的Cox模型下的鞅残差对该协变量作图可揭示该变量在全模型中的函数形式。结果:实例分析表明,Loess平滑鞅残差图可用于Cox模型中协变量函数形式的确定。结论:建议分析者把鞅残差图纳入Cox模型分析中,对协变量的生存效应作出正确估计。  相似文献   

12.
在临床研究中,当只知道事件发生在某一给定的时间区间内,而不知道其确切时间点时,将这类数据称为区间删失数据(interval censored data),表示为T∈(L,R][1],其中T表示个体的生存时间,L表示删失区间的下界,R表示上界。显而易见,区间删失包括左删失和右删失,临床研究中,区间删失现象比较常见,特别是在患者进行周期性随访的临床试验和队列研究中。  相似文献   

13.
正在临床研究中,当只知道事件发生在某一给定的时间区间内,而不知道其确切时间点时,将这类数据称为区间删失数据(interval censored data),表示为T∈(L,R][1],其中T表示个体的生存时间,L表示删失区间的下界,R表示上界。显而易见,区间删失包括左删失和右删失,临床研究中,区间删失现象比较常见,特别是在患者进行周期性随访的临床试验和队列研究中。在处理区间删失数据时,很多研究者往往为简便起见,直接用删失区间的中点或右端点作为生存时间  相似文献   

14.
目的建立非正态纵向数据的随机序列生成方法。方法根据任意累积分布函数均服从[0,1]的均匀分布原理,通过反函数计算即可将标准多元正态分布随机序列转换为任意分布下的目标随机序列,从而随机生成非正态纵向数据。结果分别对指数分布和二项分布相关序列进行模拟随机数生成,通过对样本的统计分析,均满足预先设定的结果。结论本文提出的非正态纵向数据的随机生成的Monte Carlo模拟方法可产生任意分布下的相关随机序列,不受变量类型限制,方法简单,且具有理论依据,为非正态纵向数据的研究提供了模拟基础。  相似文献   

15.
利用三次样条函数考察Cox模型比例风险假定   总被引:3,自引:2,他引:1  
目的 介绍一种检查Cox模型比例风险假定的假设检验方法。方法 利用时间的三次样条函数评价Cox比例风险回归模型中的时协变量交互作用项。结果 该法灵活有效,并且提供LHRF的点估计和区间估计。结论 三次样条回归作为一种检验方法,可与其他检验方法或图法结合使用,以考察Cox模型比例风险假定。  相似文献   

16.
目的 比较随机生存森林模型、梯度提升模型、极限梯度提升模型与Cox比例风险回归模型对生存数据的区分度性能,为生存分析方法的应用提供参考。方法 基于基准实验框架,选择SEER数据库、TCGA数据库、R软件包共13个数据集,分别构建三种机器学习模型与Cox模型,以嵌套交叉验证获得Harrell’s C-index作为模型区分度性能评价指标,采用秩和检验比较模型间性能。结果 各数据集的C-index主要集中在0.6~0.75之间。单数据集的结果不全相同,各模型C-index差异仅在部分数据集有意义,且没有一致结论;四种方法的性能在所有数据集、高删失率数据集、低删失率数据集等不同组数据集间的C指数差异均无统计学意义。结论 在不同场景下的生存数据分析中,三种机器学习模型区分度性能与传统Cox模型相近。  相似文献   

17.
目的研究核心家系资料中删失性状的遗传方差分量模型,评价环境因素和遗传因素对删失性状的影响。方法应用多变量脆弱模型研究删失性状的遗传方差分量,基础模型选用Cox比例危险模型,MCMC方法用于参数估计,原发性肝癌核心家系发病年龄资料的分析说明了该方法的实际应用。结果实例分析结果符合专业解释,该模型对生存时间分布没有要求因而有更广泛的适用性。结论基于Cox回归模型的遗传方差分量模型可用于家系资料,研究生存时间资料的遗传和环境因素的作用。  相似文献   

18.
目的建立非正态纵向数据的随机序列生成方法。方法根据任意累积分布函数均服从[0,1]的均匀分布原理,通过反函数计算即可将标准多元正态分布随机序列转换为任意分布下的目标随机序列,从而随机生成非正态纵向数据。结果分别对指数分布和二项分布相关序列进行模拟随机数生成,通过对样本的统计分析,均满足预先设定的结果。结论本文提出的非正态纵向数据的随机生成的Monte Carlo模拟方法可产生任意分布下的相关随机序列,不受变量类型限制,方法简单,且具有理论依据,为非正态纵向数据的研究提供了模拟基础。  相似文献   

19.
目的 探讨不同条件下的数据对于多水平删失正态回归模型参数点估计及其标准误的影响.方法 模拟二水平删失正态回归数据,分别拟合二水平正态回归模型和二水平删失正态回归模型,并给出不同的一、二水平样本量及内相关系数条件,比较其参数点估计及参数标准误估计结果.结果 二水平样本量越大,固定系数、一水平残差及残差间协方差的标准误估计越准确,而方差成分标准误估计的准确性对于一水平样本量要求较弱,内相关系数对参数标准误估计的准确性影响不大.结论 存在删失因变量的多水平结构数据应使用多水平删失正态回归模型进行参数估计,其标准误与合适的各水平样本含量及内相关系数有关.  相似文献   

20.
目的集成学习是近年来机器学习领域中被广泛应用的一种新的、用来提高学习精度的算法。本文旨在介绍基于super learner算法的集成学习方法在纵向删失数据预测建模中的应用及其R语言实现。方法本文介绍了super learner算法的基本原理及其在纵向删失数据建模中的应用,以及如何在R语言中实现该算法的建模。其次,应用TCGA数据库中的肿瘤生存数据进行实例分析,展示其在实际数据分析中的应用效果。结果基于super learner算法的集成学习方法在建模时,模型参数估计方法的选择和算法参数的定义均较为灵活。在实际数据分析中,super learner算法可以充分利用所获得的数据建立模型,模型的预测准确度为0.8737(95%CI:0.7897~0.9330),C-index为0.883,预测准确性较高。结论基于super learner算法的集成学习方法为纵向删失数据的预测建模分析提供了新的选择。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号