期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈丽嫦衡明莉王骏陈平雁《现代预防医学》2020,(20):3684-3687

目的比较在处理多种缺失机制共存的定量纵向缺失数据时,基于对照的模式混合模型（PMM）、重复测量的混合效应模型（MMRM）以及多重填补法(MI)的统计性能。方法采用Monte Carlo技术模拟产生包含完全随机缺失、随机缺失和非随机缺失中两种或三种缺失机制的定量纵向缺失数据集,评价三类处理方法的统计性能。结果基于对照的PMM控制Ⅰ类错误率在较低水平,检验效能最低。MMRM和MI的Ⅰ类错误率可控,检验效能高于基于对照的PMM。两组疗效无差异的情况下,所有方法的估计误差相当,基于对照的PMM方法的95%置信区间覆盖率最高;有差异的情况下,各方法受符合其缺失机制假设的缺失比例大小影响。含有非随机缺失数据时,基于对照的PMM基本不高估疗效差异,95%置信区间覆盖率最高,MMRM和MI高估疗效差异,95%置信区间覆盖率较低。所有方法的95%置信区间宽度相当。结论分析多种缺失机制共存,特别是含有非随机缺失的纵向缺失数据时,MMRM和MI的统计性能有所降低,可采用基于对照的PMM进行敏感性分析,但需要注意其具体假设,防止估计过于保守。相似文献

2.

存在缺失数据的非劣效临床试验中不同分析方法的模拟比较研究

吴振强孙业桓李卫王杨《中华疾病控制杂志》2013,17(7):629-633

目的探讨适用于非劣效试验设计下重复测量数据的统计分析方法。方法基于某临床研究的基本指标,应用Monte Carlo模拟方法,分别模拟出完整的重复测量数据和不同缺失机制下不同缺失比例的数据;运用不同的统计分析方法对模拟数据进行统计分析,通过检验效能、Ⅰ类错误等指标比较不同分析方法的性能。结果完整数据下,多数的统计分析方法均能达到或近似达到较理想的检验效能和Ⅰ类错误;存在数据缺失的情况下,基于非结构化协方差矩阵的重复测量混合效应模型（mixed-effect model repeated measure,MMRM）和不同协方差结构的广义估计方程（generalized estimated equation,GEE）表现出良好的稳定性,能在保证足够检验效能的情况下,有效的控制Ⅰ类错误;非劣效试验设计下,不同缺失比例的模拟结果均显示,末次结转（last observation carried forward,LOCF）的方法会低估组间的差异,造成Ⅰ类错误膨胀。结论基于非劣效试验设计的重复测量数据,当数据存在缺失时,LOCF结转方法会低估组间的差异,造成I类错误的膨胀,不再是一种保守的缺失值处理... 相似文献

3.

多种填补方法在纵向缺失数据中的比较研究 总被引：1，自引：0，他引：1

《中国卫生统计》2016,(1)

目的比较多种方法对纵向缺失数据的处理效果。方法运用SAS软件通过蒙特卡罗模拟产生最常见的含一个分组因素和一个重复测量因素的纵向资料,对其进行混合效应模型分析,将结果作为标准对照。分别构建任意缺失模式(AMP)和单调缺失模式(MMP)下完全随机缺失(MCAR)、随机缺失(MAR)和非随机缺失(NMAR)六种缺失数据集,并使缺失率分别为10%、20%、30%、40%和50%,运用删除法、单一填补法、多重填补法和EM算法进行处理。结果在AMP下,当MCAR和MAR时,低缺失率(≤10%)下所有方法的效果均较好;随着缺失率的增大,只有多重填补法的效果令人满意。在MMP下,当MCAR和MAR时,只有线性回归法和预测均数匹配法的效果较好。多重填补法的缺点是在一定程度上高估系数的变异程度。另一方面,填补方法对结果的影响远超过填补次数对结果的影响。当NMAR时,所有方法都无法取得较好的处理效果。结论对于纵向缺失资料,多重填补法仍是一种较为理想的处理方法。相似文献

4.

meta分析预测法在二分类终点临床试验中的应用

贺志强仲子航倪森淼刘文甘世林黄清浩尹健王媛媛耿睿柏建岭于浩《中国卫生统计》2023,(2):300-303

目的探讨meta分析预测(meta analytic predictive, MAP)法在二分类终点临床试验中借用历史对照组数据的信息。方法通过模拟试验评价历史试验数据的异质性及先验数据冲突对于研究的Ⅰ类错误及检验效能的影响，并对Secukinumab治疗强直性脊柱炎的实际案例进行分析。结果当先验数据冲突不存在时，MAP方法能较好地控制Ⅰ类错误并提高检验效能。随着历史试验间异质性增加，Ⅰ类错误会略有膨胀而检验效能略有降低。当先验数据冲突时，会造成Ⅰ类错误膨胀，若历史试验利于试验组优于对照组的结论时检验效能会增加，反之检验效能会降低。Secukinumab治疗强直性脊柱炎的案例显示，MAP方法能够在新试验对照组样本量较少的情况下，借用历史试验信息，可以识别出试验药与对照药的差异。结论本文对临床试验中信息借用的MAP方法提供了方法学和案例研究支持，评估了先验数据冲突及异质性对信息借用的影响，具有较强的实用价值。相似文献

5.

基因表达谱的非参缺失森林填补算法研究

《中国卫生统计》2016,(6)

目的评估不同基因表达谱数据集下,多种算法在缺失数据中的填补效果,并分析其对无监督基因表达谱聚类的影响。方法在不同缺失比例的情况下,分别采用非参缺失森林填补法、贝叶斯线性回归法、蒙特卡洛多重填补法和K邻近填补法进行填补,通过均方根误差(NRMSE)和聚类准确率(F值)两个指标来评估不同方法的填补效能和聚类效果,并用模拟数据集进行测试和乳腺癌数据集进行验证。结果随着缺失比例的增加,四种填补方法的NRMSE都逐渐上升;任意缺失比例下,相比于其他三种方法非参缺失森林填补法的填补优势明显。缺失比例为5%、10%、20%和30%的乳腺癌数据集,非参缺失森林填补法的NRMSE依次为0.1951(95%CI,0.1945~0.1953)、0.2776(95%CI,0.2783~2791)、0.4003(95%CI,0.3986~0.4002)和0.4974(95%CI,0.4658~0.5104);聚类效果的准确率为1.0、0.91、0.88和0.82。结论非参缺失森林填补算法实现简单,对数据集的要求较低,比传统填补算法具有更好的稳定性和精确度,可保留较多的基因信息供后续的功能聚类等分析。相似文献

6.

多重填补法与Ad Hoc法对模拟纵向数据集缺失值处理的比较 总被引：3，自引：0，他引：3

茅群霞李晓松《现代预防医学》2005,32(4):310-312

目的：采用多重填补法(multiple imputation，MI)和Ad hoc法分别对模拟的纵向数据集中的缺失值进行处理，较两种方法的优劣并探讨其适用性。方法：运用SAS9．0，采用数据模拟技术，分别模拟纵向完整数据集和具有各种缺失的随机缺失数据集，分别用MI和Ad hoc法对各缺失数据集进行处理，对结果进行比较和分析。结果：数据缺失率≤％时，Ad hoc方法有一定优势；数据缺失率在20％-40％时，经MI处理后的分析结果更接近“真实”；数据缺失率≥50％时，两种方法均无效。结论：对不同缺失率的数据集，MI和Ad hoc法对缺失值的处理各有优劣。相似文献

7.

二分类数据缺失多重填补分析及应用

《中国卫生统计》2014,(3)

目的阐明四种填补方法(multiple imputation,MI)的基本原理,实例介绍纵向研究二分类缺失数据多种填补方法的应用。方法对比分析简单填补、分层填补、考虑个体差异的填补及考虑个体、抽样的多重填补等四种填补方法;模拟证实几种OR取值的敏感性分析。结果进行大样本(N=10000)模拟研究表明:简单多重填补分析会降低检验效能,不能客观反应两样本的差异;考虑先前信息的分层多重填补会扩大I型错误;若只考虑个体变异,仅模拟一个数据集,所得结论不稳定;在考虑个体、抽样和填补差异后模拟的多重填补数据集,当OR≈2时,所得统计量基本接近真值;实例验证,经高血压知晓干预后,尚不能认为两区的吸烟率有差别。结论不考虑前次观察数据以及OR值的影响,一味地把缺失值当作该事件发生处理,会加大I型错误;只有综合考虑个体、抽样和填补差异,多重填补数据集的估计结果才更具稳健性。相似文献

8.

几种纵向缺失数据填补方法的比较及在阿尔茨海默病随访数据中的应用

韩红娟葛晓燕刘龙杨林余红梅《现代预防医学》2018,(22):4033-4037

目的针对纵向缺失数据,比较几种适用的填补方法并从中选择最佳方法用于阿尔茨海默病随访资料的数据缺失填补。方法针对随机缺失机制且缺失变量为连续变量的纵向缺失资料,模拟缺失比例分别为10%、20%、30%、40%和50%的随机数据集,结合末次观察值结转(Last Observation Carried Forward, LOCF )填补方法、马尔可夫链蒙特卡罗填补法(Markov Chain Monte Carlo, MCMC)、全条件定义法(Fully Conditional Specification, FCS)进行填补,采用无偏性和有效性评价指标,比较填补效果,选取最理想的填补方法,并将该方法应用于阿尔茨海默病随访研究中收缩压和蒙特利尔认知评估量表（Montreal Cognitive Assessment, MoCA）得分的填补。结果（1）纵向缺失资料中若不考虑时间变量,在处理几个连续性的缺失变量时,MCMC法在各缺失率下填补均优势明显,LOCF填补法在缺失率较低时具有一定的效果,且方法简单,而FCS法的填补结果均不太好。当数据缺失比较严重,缺失率高于40%时,各种填补方法的填补结果均不佳。（2）将MCMC法用于填补阿尔茨海默病的随访缺失数据,当填补次数为3时,收缩压和MoCA得分两指标的填补效果最佳。结论为了得到最理想的结果,在处理缺失数据时填补方法和适当的填补次数都需要考虑。相似文献

9.

小样本内部预试验自适应设计中Ⅰ型错误和检验效能的控制及模拟

王素珍孟维静艾晓伟夏结来《中国卫生统计》2011,28(5)

目的通过盲态下内部预试验IPS( internal pilot study)样本量调整的模拟分析,探索小样本下有效控制Ⅰ型错误、保证检验效能的合理统计方法.方法利用蒙特-卡罗( Monte Carlo)模拟不断改变两总体间的均值差,固定方差,在盲态下采用随机化检验进行统计分析,计算Ⅰ型错误和检验效能随均值差的变化情况.结果盲态下Ⅰ型错误未超过检验水准,检验效能略有降低.结论盲态小样本下调整样本量时,采用随机化检验可有效控制Ⅰ型错误. 相似文献

10.

多重填补的方法及其统计推断原理 总被引：6，自引：0，他引：6

曹阳谢万军张罗漫《中国医院统计》2003,10(2):77-81

目的描述数据缺失的特征和数据缺失模式，对Rubin最早提出的多重填补(multiple imputation,MI)的基本概念、填补和分析缺失数据的方法、综合统计推断进行了探讨，分析了MI的特点、局限性以及应用MI方法处理不完整数据集时需要注意的地方。方法通过计算机模拟，用MI方法将每一个缺失值用一系列可能的值填补，然后使用常规的、针对完全数据集的统计方法对多重填补后得到的若干数据集进行分析，并把所得的结果进行综合。结果多重填补值显示出了缺失数据的不确定性，使得已有数据得到了充分利用，从而对总体参数做出了更为准确的估计。结论 MI方法为处理存在缺失值的数据集提供了有用的策略，并且适用于多种数据缺失的场合。相似文献

11.

队列研究中纵向缺失数据填补方法的模拟研究

下载免费PDF全文

李业棉赵芃杨嵛惠王静娴颜虹陈方尧《中华流行病学杂志》2021,42(10):1889-1894

目的数据缺失是队列研究中几乎无法避免的问题。本文旨在通过模拟研究,比较当前常见的8种缺失数据处理方法在纵向缺失数据中的填补效果,为纵向缺失数据的处理提供有价值的参考。方法模拟研究基于R语言编程实现,通过Monte Carlo方法产生纵向缺失数据,通过比较不同填补方法的平均绝对偏差、平均相对偏差和回归分析的Ⅰ类错误,评价不同填补方法对于纵向缺失数据的填补效果及对后续多因素分析的影响。结果均值填补、k近邻填补（KNN）、回归填补和随机森林的填补效果接近,且表现稳定;多重插补和热卡填充次于以上填补方法;K均值聚类和EM算法填补效果最差,表现也最不稳定。均值填补、EM算法、随机森林、KNN和回归填补可较好地控制Ⅰ类错误,多重插补、热卡填充和K均值聚类不能有效控制Ⅰ类错误。结论对于纵向缺失数据,在随机缺失机制下,均值填补、KNN、回归填补和随机森林均可作为较好的填补方法,当缺失比例不太大时,多重插补和热卡填充也表现较好,不推荐K均值聚类和EM算法。相似文献

12.

基于内部预试验方差及组间差值的样本量调整模拟

王素珍孟维静吕军城石福艳夏结来《中国医院统计》2012,19(3):169-172

目的通过盲态下内部预试验IPS样本量调整的模拟分析,探索协变量存在前提下有效控制Ⅰ型错误、保证检验效能的合理统计方法.方法利用蒙特-卡罗法模拟存在协变量时的两阶段自适应设计过程,分别采用协方差分析法和方差分析法分析两阶段数据,采用合并P值法确定检验的最终结果,比较两种方法对Ⅰ型错误、检验效能值的影响.结果采用方差分析的Ⅰ型错误膨胀较协方差分析要大,检验效能也较协方差分析略低,但是Ⅰ型错误的增大更明显.结论根据第一阶段的方差和组间均值差调整样本量时,如果存在协变量,应采用协方差分析方法分别分析第一、二阶段的数据,然后采用合并P值法做出统计推断. 相似文献

13.

定量数据考虑基线与否的几种方差分析模型的模拟比较

刘冠东陈平雁《中国卫生统计》2020,(2):182-185,189

目的比较几种考虑基线与否的方差分析模型的统计性能。方法应用Monte Carlo技术,在基线均衡和不均衡情况下,比较以下方差分析模型:以基线为协变量的变化量协方差分析(ANCOVA)、变化率协方差分析(PCS-ANCOVA)和对数变化率协方差分析(logPCS-ANCOVA);不考虑基线的变化量方差分析(ANOVA)、变化率方差分析(PCS-ANOVA)和对数变化率方差分析(logPCS-ANOVA)。以I类错误与检验效能评价各种方法的统计性能。结果在基线均衡的情况下,PCS-ANCOVA和ANOVA均可很好地控制I类错误,且检验效能都较高;在基线不均衡的条件下,若基线对因变量无影响,ANCOVA与ANOVA均可以较好地控制I类错误,此时ANOVA的检验效能高于ANCOVA;若基线对因变量有影响时,只有ANCOVA可以很好地控制I类错误,且检验效能较高,其他方法效果不佳。结论考虑到实际应用中绝大部分情况是基线对因变量有影响,即相关,建议优先采用以基线为协变量的协方差分析或变化量的协方差分析,无论基线是否均衡。用变化率做方差分析或协方差分析,有可能冒着比值的分布不满足参数方法条件的风险,应用时应慎重。相似文献

14.

完全随机缺失条件下分类随机变量数据缺失插补方法的比较研究

《中国卫生统计》2015,(5)

目的探讨完全随机缺失条件下分类随机变量数据缺失对研究结果的影响,对各方法插补效果进行评价。方法基于上海地区35岁及以上吸烟人群吸烟与肺癌死亡关系的完整数据集,在5%、10%、20%及30%缺失率下,模拟有序分类变量(吸烟年数分组syfz)缺失和二分类变量(性别sex)缺失,重复模拟100次。采用删除法、众数插补法、多重插补-logistic回归法(MI/logistic)及多重插补-判别分析法(ML/discrim)对分类变量数据缺失进行处理。对插补效果从插补正确率及插补后模型参数的变化两个方面进行评价。结果有序分类变量缺失:各缺失率下,MI/logistic插补的正确率最高,MI/logistic和MI/discrim插补后模型参数的偏差均较小,对于吸烟年数sy以分组形式syfz纳入模型数据缺失导致模型参数的相对偏差更小,对syfz插补后模型参数相对偏差也小于连续变量sy插补后模型参数相对偏差。二分类变量缺失:各缺失率下,众数插补的正确率最高,删除法处理缺失数据后模型参数的偏差最小。结论连续变量缺失对模型结果的影响大于分类变量缺失,对于有数据缺失的连续变量可将其离散化,以分类变量的形式进行分析。缺失数据插补模型的拟合效果会直接影响插补效果,当模型拟合效果较差时可能会带来更大的偏差。相似文献

15.

四格表资料χ2检验专用公式与校正公式及确切概率法的比较

陈国民王洁贞《中国卫生统计》2002,19(3)

目的探讨四格表资料χ2检验是否需要连续性校正以及是否需要用确切概率法.方法用计算机模拟从两个总体(π1=π2)中随机抽取100000个样本,用四格表专用公式、校正公式和确切概率法进行假设检验,统计三种方法犯第一类错误的频率;模拟从两个总体(π1≠π2)中随机抽取100000个样本,用以上三种方法进行假设检验,统计判断正确的频率(检验效能).结果专用公式犯第一类错误的频率比校正公式和确切概率法更接近检验水准α;专用公式的检验效能高于校正公式和确切概率法.结论对四格表资料不宜进行连续性校正,确切概率法也未必是最好的方法. 相似文献

16.

疾病预后研究的中介分析方法评价

《中国卫生统计》2017,(3)

目的对用于癌症预后研究的五种中介分析方法(VanderWeele法、Baron-Kenny法、Imai法、Sobel法和InverseWeight法)进行评价,为实例分析的方法选择提供依据。方法基于模拟试验,产生不同参数设置下的模拟数据,并评价五种方法的第一类错误、检验效能和分析时间。结果除InverseWeight法在相关系数较大时第一类错误有所膨胀外,其余四种方法的第一类错误在不同参数情况下均在0.05附近。五种方法的检验效能趋势一致,均随着样本量、中介比、总效应的增大而增大,随着删失比的增大而减小。在样本量较小(N=100)且中介比不大于30%的情况下,InverseWeight法的检验效能低于另四种方法。InverseWeight法、Baron-Kenny法和Imai法的分析效率远低于VanderWeele法和Sobel法。结论综合考虑一类错误控制、检验效能及分析效率,推荐VanderWeele法进行预后研究的中介分析。相似文献

17.

多重填补法和多水平模型在纵向随访数据中的应用

吴秋红张丕德周国茂罗珍胄《中华疾病控制杂志》2016,20(7):729-733

目的探讨在纵向随访数据中如何处理缺失值和相关性,充分利用所收集到的数据来反映研究总体。方法先模拟产生纵向完整数据集和缺失数据集,然后用多重填补法（multiple imputation methods,MI）和多水平模型（multilevel model,MLM）来处理,再用随机区组方差分析比较各组的差异,最后用实例验证。结果不同缺失类型和不同缺失比例的数据集所得结果一致:基于MI的MLM所得的偏差比MLM小,且随着填补次数的增多而有所减小;偏差随着缺失率的增大而增加,样本量大的结果更稳定。实例分析也验证了模拟的结果。结论用多重填补法和多水平模型共同处理纵向随访数据可以提高结果的准确性和精确性。相似文献

18.

无删失生存数据Wilcoxon秩和检验与logrank检验的比较

陈靖何春拉潘建红陈平雁《中国卫生统计》2012,29(5)

目的比较Wilcoxon秩和检验与logrank检验处理无删失生存数据的统计性能.方法采用MonteCarlo模拟方法,应用SAS9.1.3软件编程,比较两种检验方法的Ⅰ型错误率和检验效能.结果小样本情形(n≤50)下,Wilcoxon秩和检验的Ⅰ型错误率较logrank检验更接近检验水准0.05,而检验效能与logrank检验相差不大,后者检验效能的提高是以扩大Ⅰ型错误率为代价的.结论对于无删失生存数据的比较,尤其是小样本情形(n≤50)下,建议采用Wilcoxon秩和检验. 相似文献

19.

用t检验比较多个均数犯Ⅰ类错误概率的SAS电脑实验

韩耀风方亚《中国卫生统计》2010,27(5)

在"医学统计学"课程教学中,对于多个均数的比较能否用t检验,往往是通过讨论说明直接用t检验可增大犯Ⅰ类错误的概率,从而引出方差分析的方法.针对这一部分内容的教学,如果辅以相应的电脑实验则可帮助学生理解"多个均数的比较不宜用t检验代替"的缘由.然而在现有的教材里,主要存在两个问题:(1)犯Ⅰ类错误的判定不明确;(2)得出的犯Ⅰ类错误的概率不符合概率的统计定义[1]. 相似文献

20.

基于健康信念模型的北京市某三级甲等医院孕妇口腔卫生保健行为及影响因素的分析题录

张志媛郑丹萍王茜谢嫣王欣欣万阔付晨薇霍晓鹏《中华预防医学杂志》2024,(3)

目的基于健康信念模型分析孕妇口腔卫生保健行为的影响因素。方法采用横断面调查的方法, 于2022年7至12月在北京协和医院驻点, 对到院做产前检查的316名孕妇应用孕妇口腔卫生保健行为的健康信念问卷及自我效能量表进行调查。采用t检验和χ2检验分析健康信念、自我效能等社会心理学因素对口腔保健行为的影响。结果纳入孕妇316名中, 110(34.8%)名孕妇日常口腔保健行为不佳, 120(38.1%)名的孕妇在孕前或孕期未行口腔检查。孕妇整体口腔保健的健康信念不高, 得分为6.63+3.23、中位得分为7(5)。感知口腔疾病的易感性(OR=1.51, 95%CI:1.026～2.213)、日常生活的自我效能(OR=2.64, 95%CI:1.384～5.040)、口腔检查的自我效能(OR=1.74, 95%CI:1.184～2.570)是孕妇日常口腔卫生保健行为的独立影响因素。健康动力(OR=2.47, 95%CI:1.474～4.126)及口腔检查的自我效能(OR=4.17, 95%CI:2.626～6.619)是孕妇孕前及孕期口腔检查行为的独立影响因素。结论孕妇口腔保健的健康信念特别是感知... 相似文献