期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	1篇

专业分类

预防医学

3篇

出版年

2021年	2篇
2012年	1篇

排序方式： 共有3条查询结果，搜索用时 78 毫秒

队列研究中纵向缺失数据填补方法的模拟研究

下载免费PDF全文

李业棉赵芃杨嵛惠王静娴颜虹陈方尧《中华流行病学杂志》2021,42(10):1889-1894

目的数据缺失是队列研究中几乎无法避免的问题。本文旨在通过模拟研究,比较当前常见的8种缺失数据处理方法在纵向缺失数据中的填补效果,为纵向缺失数据的处理提供有价值的参考。方法模拟研究基于R语言编程实现,通过Monte Carlo方法产生纵向缺失数据,通过比较不同填补方法的平均绝对偏差、平均相对偏差和回归分析的Ⅰ类错误,评价不同填补方法对于纵向缺失数据的填补效果及对后续多因素分析的影响。结果均值填补、k近邻填补（KNN）、回归填补和随机森林的填补效果接近,且表现稳定;多重插补和热卡填充次于以上填补方法;K均值聚类和EM算法填补效果最差,表现也最不稳定。均值填补、EM算法、随机森林、KNN和回归填补可较好地控制Ⅰ类错误,多重插补、热卡填充和K均值聚类不能有效控制Ⅰ类错误。结论对于纵向缺失数据,在随机缺失机制下,均值填补、KNN、回归填补和随机森林均可作为较好的填补方法,当缺失比例不太大时,多重插补和热卡填充也表现较好,不推荐K均值聚类和EM算法。相似文献

基于super learner算法的集成学习及其在纵向删失数据预测建模中的应用

杨嵛惠王静娴赵芃李业棉陈方尧《中国医院统计》2021,(1)

目的集成学习是近年来机器学习领域中被广泛应用的一种新的、用来提高学习精度的算法。本文旨在介绍基于super learner算法的集成学习方法在纵向删失数据预测建模中的应用及其R语言实现。方法本文介绍了super learner算法的基本原理及其在纵向删失数据建模中的应用,以及如何在R语言中实现该算法的建模。其次,应用TCGA数据库中的肿瘤生存数据进行实例分析,展示其在实际数据分析中的应用效果。结果基于super learner算法的集成学习方法在建模时,模型参数估计方法的选择和算法参数的定义均较为灵活。在实际数据分析中,super learner算法可以充分利用所获得的数据建立模型,模型的预测准确度为0.8737(95%CI:0.7897~0.9330),C-index为0.883,预测准确性较高。结论基于super learner算法的集成学习方法为纵向删失数据的预测建模分析提供了新的选择。相似文献

样本量估计及其在nQuery和SAS软件上的实现——率的比较(三)

陈方尧段重阳张惠风陈平雁《中国卫生统计》2012,29(6):920-923

2.1 两样本/多样本率的比较 2.1.1差异性检验 2.1.1.1 两样本率比较的Pearson x2检验(估计样本量或检验效能) 方法:Machin和Campbell(1987)[7]、Fleiss等(1980)[8]提出样本量估计是建立在大样本正态逼近基础上的,其公式为, 相似文献