排序方式: 共有3条查询结果,搜索用时 78 毫秒
1
1.
目的 数据缺失是队列研究中几乎无法避免的问题。本文旨在通过模拟研究,比较当前常见的8种缺失数据处理方法在纵向缺失数据中的填补效果,为纵向缺失数据的处理提供有价值的参考。方法 模拟研究基于R语言编程实现,通过Monte Carlo方法产生纵向缺失数据,通过比较不同填补方法的平均绝对偏差、平均相对偏差和回归分析的Ⅰ类错误,评价不同填补方法对于纵向缺失数据的填补效果及对后续多因素分析的影响。结果 均值填补、k近邻填补(KNN)、回归填补和随机森林的填补效果接近,且表现稳定;多重插补和热卡填充次于以上填补方法;K均值聚类和EM算法填补效果最差,表现也最不稳定。均值填补、EM算法、随机森林、KNN和回归填补可较好地控制Ⅰ类错误,多重插补、热卡填充和K均值聚类不能有效控制Ⅰ类错误。结论 对于纵向缺失数据,在随机缺失机制下,均值填补、KNN、回归填补和随机森林均可作为较好的填补方法,当缺失比例不太大时,多重插补和热卡填充也表现较好,不推荐K均值聚类和EM算法。 相似文献
2.
目的集成学习是近年来机器学习领域中被广泛应用的一种新的、用来提高学习精度的算法。本文旨在介绍基于super learner算法的集成学习方法在纵向删失数据预测建模中的应用及其R语言实现。方法本文介绍了super learner算法的基本原理及其在纵向删失数据建模中的应用,以及如何在R语言中实现该算法的建模。其次,应用TCGA数据库中的肿瘤生存数据进行实例分析,展示其在实际数据分析中的应用效果。结果基于super learner算法的集成学习方法在建模时,模型参数估计方法的选择和算法参数的定义均较为灵活。在实际数据分析中,super learner算法可以充分利用所获得的数据建立模型,模型的预测准确度为0.8737(95%CI:0.7897~0.9330),C-index为0.883,预测准确性较高。结论基于super learner算法的集成学习方法为纵向删失数据的预测建模分析提供了新的选择。 相似文献
3.
1