首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
目的 分析我国MSM人群HIV感染者(MSM感染者)病毒载量(VL)抽样调查数据缺失及对调查结果的影响。方法 利用国家科技重大专项课题2013-2015年在北京、上海、南京、杭州、武汉、重庆、昆明、西安、广州、深圳、南宁、乌鲁木齐、哈尔滨、长春、成都和天津16个大城市MSM人群中开展的HIV感染者VL抽样调查数据库,采用SPSS 17.0软件对VL缺失数据进行描述性分析。结果 在12 150名随机抽样的MSM感染者中,75.2%(9 141/12 150)调查对象接受了VL数据收集,24.8%(3 009/12 150)调查对象VL数据缺失;目前正在接受抗病毒治疗与未接受抗病毒治疗者缺失率分别为11.5%(765/6 675)、39.4%(2 060/5 223);本地与外地户籍VL数据缺失率分别为21.9%(1 866/8 523)、28.4%(959/3 374)。结论 MSM感染者VL抽样调查存在一定比例的数据缺失,抗病毒治疗和户籍是VL数据缺失的主要影响因素,VL数据缺失会对准确评价MSM感染者社区病毒载量水平和人群病毒载量水平造成影响。  相似文献   

2.
用Stat/Transfer进行数据转换   总被引:1,自引:1,他引:0  
不同统计软件在处理数据时各有所长。当我们用不同软件处理同一数据对象时,存在着一个数据转换(data transfer)问题。通常,不同软件的数据文件不是不能直接转换,就是转换过程比较复杂[1];例如,最常用的统计软件SPSS在11.0以前的版本还不能实现与SAS数据的直接转换。即使这些权威的统计软件具有了较强的数据转换功能,但对某些数据(库)类型的转换仍无能为力,例如SPSS和SAS就不具备与另一个极具影响的统计软件Minitab的数据转换功能。而Stat/Transfer软件[2]恰恰可以方便地解决这一问题,其操作简单,包含的数据类型广泛,下面简要介绍之。…  相似文献   

3.
数据缺失及其填补方法综述   总被引:6,自引:0,他引:6  
在社会调查资料中,最为常见的问题就是数据缺失。造成数据缺失的原因有:失访、无响应或是回答问题不合格等等。统计学上,将含有缺失数据的记录称为不完全观测。缺失数据或不完全观测对调查研究的影响是很大的。所以在统计学中,为了能够更加充分地利用已经搜集到的数据,国内外很  相似文献   

4.
目的 针对纵向缺失数据,比较几种适用的填补方法并从中选择最佳方法用于阿尔茨海默病随访资料的数据缺失填补。方法 针对随机缺失机制且缺失变量为连续变量的纵向缺失资料,模拟缺失比例分别为10%、20%、30%、40%和50%的随机数据集,结合末次观察值结转(Last Observation Carried Forward, LOCF )填补方法、马尔可夫链蒙特卡罗填补法(Markov Chain Monte Carlo, MCMC)、全条件定义法(Fully Conditional Specification, FCS)进行填补,采用无偏性和有效性评价指标,比较填补效果,选取最理想的填补方法,并将该方法应用于阿尔茨海默病随访研究中收缩压和蒙特利尔认知评估量表(Montreal Cognitive Assessment, MoCA)得分的填补。结果 (1)纵向缺失资料中若不考虑时间变量,在处理几个连续性的缺失变量时,MCMC法在各缺失率下填补均优势明显,LOCF填补法在缺失率较低时具有一定的效果,且方法简单,而FCS法的填补结果均不太好。当数据缺失比较严重,缺失率高于40%时,各种填补方法的填补结果均不佳。(2)将MCMC法用于填补阿尔茨海默病的随访缺失数据,当填补次数为3时,收缩压和MoCA得分两指标的填补效果最佳。结论 为了得到最理想的结果,在处理缺失数据时填补方法和适当的填补次数都需要考虑。  相似文献   

5.
目的 结合调查数据,比较不同量表资料缺失数据的处理方法.方法 对不同缺失程度的随机缺失数据集采用条目均数填补法、自身均数填补法、多重填补法分别进行处理,并模拟100次,比较填补结果.结果 缺失率较低时,几种方法效果均较好.随着缺失率增高,填补前后条目及总分一致率逐渐下降,比较而言,自身均数填补法效果最好,其次是多重填补法和条目均数填补法.结论 Epworth量表中缺失数据可采用自身均数填补法进行填补.  相似文献   

6.
居民健康调查资料中的缺失数据的多重估算   总被引:3,自引:1,他引:2  
目的 解决居民健康调查数据中存在的数据缺失问题。充分利用所采集到的数据。得出更有效的统计推断,方法 运用建立在马尔科夫链蒙特卡罗方法基础上的多重估算技术,对缺失数据进行替换,产生多个完整的数据集,进行联合统计推断。结果 弥补了由于缺失数据所造成的信息损失,改善了统计推断的质量。结论 多重估算技术是解决社会调查资料中数据缺失问题的有效工具。  相似文献   

7.
目的 数据缺失是队列研究中几乎无法避免的问题。本文旨在通过模拟研究,比较当前常见的8种缺失数据处理方法在纵向缺失数据中的填补效果,为纵向缺失数据的处理提供有价值的参考。方法 模拟研究基于R语言编程实现,通过Monte Carlo方法产生纵向缺失数据,通过比较不同填补方法的平均绝对偏差、平均相对偏差和回归分析的Ⅰ类错误,评价不同填补方法对于纵向缺失数据的填补效果及对后续多因素分析的影响。结果 均值填补、k近邻填补(KNN)、回归填补和随机森林的填补效果接近,且表现稳定;多重插补和热卡填充次于以上填补方法;K均值聚类和EM算法填补效果最差,表现也最不稳定。均值填补、EM算法、随机森林、KNN和回归填补可较好地控制Ⅰ类错误,多重插补、热卡填充和K均值聚类不能有效控制Ⅰ类错误。结论 对于纵向缺失数据,在随机缺失机制下,均值填补、KNN、回归填补和随机森林均可作为较好的填补方法,当缺失比例不太大时,多重插补和热卡填充也表现较好,不推荐K均值聚类和EM算法。  相似文献   

8.
目的 探讨不同缺失数据填补法对MSM人群HIV感染者(MSM感染者)病毒载量(VL)缺失数据的填补效果。方法 以2013年中国16个大城市MSM感染者VL抽样检测数据为基础,采用SPSS 17.0软件,模拟完整数据集和5种不同类型的缺失数据集,采用最大期望值法(EM)、回归法、均值填补法、删除法、马尔科夫链蒙特卡罗法(MCMC)对5种VL缺失数据填补处理,从数据分布、准确度、精确度3个方面比较填补效果。结果 VL数据呈偏态非连续分布,难以进行有效正态分布转化;不同填补方法对完全随机缺失数据填补效果均较好;对于其他类型缺失数据,回归法、MCMC较好保留完整数据主要分布特征;EM、回归法、均值填补法、删除法普遍低估数据均值,MCMC多高估数据均值。结论 MCMC可作为首选的VL数据对数转换后缺失数据填补方法。填补数据可作为调查人群VL均值水平估算的参考依据。  相似文献   

9.
在医学科研中,由于失访、无应答或记录不清等各种原因,经常会遇到数据缺失的问题.某些观察性研究数据,可能会有相当数量的观察对象至少有一个协变量数据缺失.在利用倾向评分法进行数据分析时,由于倾向评分(propensity score,PS)的计算依赖于这些协变量,每个观察单位只要有一个协变量的观察值缺失,就无法估计其PS值.如果忽视这些缺失值的存在,则会导致大量的观察对象在分析过程中被剔除.因此,为了充分利用所收集到的资料,尽可能得到可靠的结果,在计算PS值之前,就有必要识别各协变量的缺失程度和缺失类型,在此基础上对缺失数据进行合理的处理.  相似文献   

10.
目的:文章系统探讨基于个体水平数据的卫生经济学评价中缺失值的系列问题,为实际研究中正确处理和报告缺失值提供参考。方法:在回顾一般缺失值问题的基础上,梳理基于个体水平数据的卫生经济学评价中数据缺失的原因、类型和处理方法等。结果:多重插补法是缺失值处理方法最常见的方法,在使用该方法时要注意合理选择插补具体方法、插补建模类型和插补模型的变量。结论:当前卫生经济学评价中关于缺失值的处理和报告还未形成已达成共识的质量规范,有待未来进一步探索  相似文献   

11.
有缺失数据的2×2交叉设计的多重填补与分析   总被引:1,自引:0,他引:1  
目的探讨利用Rubin提出的多重填补的方法处理有缺失数据的2×2交叉设计的资料,以避免医学科研中常常发生观测数据的缺失而造成统计分析的困难。方法用MI对缺失数据进行填补,用标准的统计程序对填补后的数据集分析,最后用多重填补分析综合各个数据集的统计分析结果。结果多重填补的方法可用于交叉设计中缺失数据的填补并得出正确的统计推断。结论多重填补与多重填补分析为处理存在缺失数据的资料提供了有效的策略。  相似文献   

12.
缺失数据问题在实际研究工作中是不可避免的,而现有统计方法的应用大都基于完整数据,因而如何恰当处理缺失数据是研究者所关心的问题。故本文将探讨不同缺失机制下缺失数据处理方法的理论框架及应用特点,以促进缺失数据处理方法在卫生统计调查中的实际应用。  相似文献   

13.
目的 比较在处理多种缺失机制共存的定量纵向缺失数据时,基于对照的模式混合模型(PMM)、重复测量的混合效应模型(MMRM)以及多重填补法(MI)的统计性能。方法 采用Monte Carlo技术模拟产生包含完全随机缺失、随机缺失和非随机缺失中两种或三种缺失机制的定量纵向缺失数据集,评价三类处理方法的统计性能。结果 基于对照的PMM控制Ⅰ类错误率在较低水平,检验效能最低。MMRM和MI的Ⅰ类错误率可控,检验效能高于基于对照的PMM。两组疗效无差异的情况下,所有方法的估计误差相当,基于对照的PMM方法的95%置信区间覆盖率最高;有差异的情况下,各方法受符合其缺失机制假设的缺失比例大小影响。含有非随机缺失数据时,基于对照的PMM基本不高估疗效差异,95%置信区间覆盖率最高,MMRM和MI高估疗效差异,95%置信区间覆盖率较低。所有方法的95%置信区间宽度相当。结论 分析多种缺失机制共存,特别是含有非随机缺失的纵向缺失数据时,MMRM和MI的统计性能有所降低,可采用基于对照的PMM进行敏感性分析,但需要注意其具体假设,防止估计过于保守。  相似文献   

14.
目的 探讨在纵向随访数据中如何处理缺失值和相关性,充分利用所收集到的数据来反映研究总体。方法 先模拟产生纵向完整数据集和缺失数据集,然后用多重填补法(multiple imputation methods,MI)和多水平模型(multilevel model,MLM)来处理,再用随机区组方差分析比较各组的差异,最后用实例验证。结果 不同缺失类型和不同缺失比例的数据集所得结果一致:基于MI的MLM所得的偏差比MLM小,且随着填补次数的增多而有所减小;偏差随着缺失率的增大而增加,样本量大的结果更稳定。实例分析也验证了模拟的结果。结论 用多重填补法和多水平模型共同处理纵向随访数据可以提高结果的准确性和精确性。  相似文献   

15.
多重填补法与Ad Hoc法对模拟纵向数据集缺失值处理的比较   总被引:3,自引:0,他引:3  
目的:采用多重填补法(multiple imputation,MI)和Ad hoc法分别对模拟的纵向数据集中的缺失值进行处理,较两种方法的优劣并探讨其适用性。方法:运用SAS9.0,采用数据模拟技术,分别模拟纵向完整数据集和具有各种缺失的随机缺失数据集,分别用MI和Ad hoc法对各缺失数据集进行处理,对结果进行比较和分析。结果:数据缺失率≤%时,Ad hoc方法有一定优势;数据缺失率在20%-40%时,经MI处理后的分析结果更接近“真实”;数据缺失率≥50%时,两种方法均无效。结论:对不同缺失率的数据集,MI和Ad hoc法对缺失值的处理各有优劣。  相似文献   

16.
目的 探讨解决环境污染监测资料中含有重度缺失的多维时间序列的补缺问题。方法 构造带有ARMA误差的线性方程组模型对缺失值进行迭代估计,通过基于带有输入序列的AR(1)模型的模拟研究和基于CO等环境监测数据的应用研究。与其他常用的3种补缺方法,即多元线性回归。单个ARIMA模型和3次样条插值法相比较。分析各方法的优劣。有关计算用SAS统计软件编程实现。结果 带有ARMA误差的线性方程组模型方法明显优于其他3种方法。结论 本研究提供的方法适合解决含有重度缺失的多维时间序列补缺问题。可以在环境监测领域应用。  相似文献   

17.
目的 简要介绍R 环境下MICE填补方法(Multivariate imputation by chained equations)的填补估算应用并评价其填补效果.方法以实际数据阐述填补估算流程,比较MICE与常见的缺失数据处理方法(删除法、均(众)数法、回归法)填补估算效果的差异.结果当数据缺失率为10%时,MICE与常见的缺失数据处理方法估算结果无明显差异,各填补方法的3种变量的回归系数估计的相对误差在10%左右.随着缺失率的增加(20%,40%),各方法回归系数估计的相对误差都增加,但MICE 3种变量的回归系数的相对误差稳定在10%~20%左右,MICE表现优于其他方法而且结果稳定,回归法次之,删除法和均(众)数法较差.当缺失率达50%时,3种类型的变量估算的误差已经较大,所有方法填补估算效果欠佳.结论 MICE较其他多重填补软件操作简便,与常见的缺失数据处理方法相比,可充分地利用缺失记录的信息,能较准确地反应调查的真实情况,值得在实际工作中推广应用.  相似文献   

18.
王功军  骆福添 《中国卫生统计》2005,22(6):402-404,407
传统流行病学研究疾病的的空间分布.探讨疾病的危险因素,总是基于较大的范围收集数据和整理资料,并进行分析处理后得出结论。这些结论因为要求观测单位(地域或人口)相对过大,淹没了疾病分布中局部的、特征性的规律,所以不可能是疾病在地理上的真实反映,也就不适合于检测与空间定位有关的环境危险因素,尤其是对于罕见病如肿瘤的发病和死亡的研究就更显出其不足。但如果我们直接用小地域资料进行参数估计,也会因为样本含量小,  相似文献   

19.
目的探讨不完全病例对照研究中对照组基因信息部分缺失时基因一环境交互作用的估计。方法在Stata9.0软件上采用MonteCarlo方法模拟不同基因信息缺失比例数据,对缺失数据采用hotdeck多重填补程序后分析和删除缺失值分析结果进行比较。结果缺失数据〈50%时,hotdeck多重填补后分析和删除缺失值分析对环境主效应、基因主效应以及基因-环境交互作用的估计系数接近完全数据的系数,随缺失比例的增加,两种方法的估计方差均增加,但hotdeck多重填补估计方差小于删除缺失值分析。结论不完全病例对照研究中,对照组基因信息缺失比例〈50%时,可以用hotdeck填补方法充分利用已有的信息估计基因-环境的交互作用,提高估计精度。  相似文献   

20.
目的:调查皮肤科护士感知的管理关怀、同情心疲乏、护理缺失状况,探讨护士感知到的管理关怀水平与同情心疲乏、护理缺失的关系,分析同情心疲乏在管理关怀与护理缺失的中介效应。方法:采用便利抽样法选取全国10省22市的406名皮肤科护士为调查对象,采用中文版管理关怀性评估量表、同情心疲乏量表和护理缺失量表进行调查。结果:皮肤科护士感知的管理关怀得分为(135.46±27.11)分;同情心疲乏量表得分为(77.82±19.18)分;护理缺失得分为(33.49±12.68)分。皮肤科护士的管理关怀与同情心疲乏呈负相关(r=-0.51,P < 0.05)、与护理缺失呈负相关(r=-0.12,P < 0.05),同情心疲乏在管理关怀对护理缺失的影响中发挥中介效应。结论:皮肤科护士感知的管理关怀显著影响护理缺失,而其中同情心疲乏这一主观因素在其中发挥中介效应,即管理关怀通过影响同情心疲乏,进而影响护理缺失的发生。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号