首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
目的:比较不同的缺失值处理方法处理随机缺失数据的效果。方法:以HIV/AIDS血液样本血红蛋白、白细胞和血尿素氮检测数据为基础,利用SAS9.1,分别模拟完整数据集和不同缺失率的数据集,从精确度、准确度和分布三方面比较不同方法对缺失数据集的处理效果。结果:任意缺失比例下血红蛋白和白细胞数据经不同的方法处理后与完整数据集比较差异无统计学意义。不同缺失比例下,多重填补(MI)法的精确度最高。缺失率10%~20%时,MI法填充后的准确度最高。缺失率30%时,成组删除法处理后的准确度最高。缺失40%以上时,准确度填充效果不稳定。不同缺失比例下,回归法、成组删除法和MI填充2次后的数据的分布特征与完整数据集一致。结论:数据缺失10%~20%时,MI法填充效果最好;缺失30%时,成组删除法处理效果最好;缺失40%以上时,所有方法填充效果均不佳。  相似文献   

2.
目的 收集四川省肿瘤医院头颈部肿瘤患者住院病案信息数据,探讨不同缺失场景下数据缺失值通过完成者数据集法、期望-极大化法(EM)、马尔可夫链-蒙特卡洛法(MCMC)3种方法处理后的标准化住院天数对标准化住院费用对数值的回归系数估计值r的优劣。方法 运用R 3.4.1软件,采用蒙特卡洛模拟,通过设定缺失比例和缺失机制模拟不同场景的缺失数据集,运用完成者数据集法、期望-极大化法、马尔可夫链-蒙特卡洛法估计不同缺失场景的模拟数据集中标准化住院天数对标准化住院费用对数值的回归系数估计值r,并与完整数据集的回归系数估计值rc结果进行比较,从准确度(各种方法估计的r与rc比较)和精确度(各种方法的r的变异程度s)两个角度进行评价。结果 3种缺失值处理方法的优劣在不同的缺失场景中均有所差异,完全随机缺失(MCAR)和随机缺失(MAR)(1∶2)机制下,当缺失比例小于30%时3种方法的估计值r均在可接受范围(rc±0.5s c);MAR(比例=2∶1)机制任意缺失比例下3种方法的估计值r均在可接受范围内;任意缺失场景下用EM法估计的r的标准误s 最小,且与rc的标准误s c最为接近。结论 在选择缺失值处理方法时,应该考虑数据的缺失比例和缺失机制。  相似文献   

3.
李清华  夏结来  薛富波 《医学争鸣》2004,25(23):2186-2189
目的 :探讨利用Rubin提出的多重填补的方法处理有缺失数据的 2× 2交叉设计的资料 ,以避免医学科研中常常发生观测数据的缺失而造成统计分析的困难 .方法 :用MI对缺失数据进行填补 ,用标准的统计程序对填补后的数据集分析 ,最后用MIANALYZE综合各个数据集的统计分析结果 .结果 :多重填补的方法可用于交叉设计中缺失数据的填补并得出正确的统计推断 .结论 :MI与MIANALYZE为处理存在缺失数据的 2× 2交叉设计的资料提供了有效的策略 .  相似文献   

4.
多变量缺失数据的不同处理方法及分析结果比较   总被引:6,自引:0,他引:6  
目的:探讨多变量缺失数据的不同处理方法对结果的影响.方法:分别利用删除含缺失值的观察、简单填补、多重填补3种方法对多变量中度缺失的925例肝癌患者的临床资料进行统计分析并对其结果进行比较.结果:不同方法所产生的结果差别较大.在α=0.05的水平下,利用多重填补处理的数据集分析得到影响肝癌患者生存时间的危险因素:临床分期、肝硬化史、门脉癌栓、g-GT和WBC;而用删除含缺失值方法得到的却是:TNM分期、碘油剂量、AST、ALP;简单填补比多重填补多产生3个危险因素,分别是:TNM分期、ALP和AFP.结论:本资料采用删除含缺失值的观察的方法结果最差;简单填补相对较好,但容易降低标准误、减小P值;而多重填补处理比较合理、科学.建议对多变量数据缺失的处理一定要慎重.  相似文献   

5.
目的:评估不同缺失值处理方法在不同缺失模式、缺失机制及缺失比例下双臂优效临床试验中的统计性能,筛选出相应的最优缺失值处理方式。方法:使用SAS 9.4 软件分别生成不同缺失模式(单调缺失或任意缺失)、缺失机制(完全随机缺失或随机缺失)以及不同缺失比例(0%~5%、5%~10%、10%~15%)的纵向模拟数据集,基于各模拟数据集分别使用不同缺失值处理策略进行疗效估计,并分别与完整数据集比较,以评价不同缺失值处理方式的统计性能。结果:当缺失比例<5%时,任意缺失模式下不同缺失值处理方式所得效应估计值均较为接近,单调缺失模式下只有重复测量混合效应模型(MMRM)以及多重填补后协方差分析误差较小。当缺失比例>5%时,不论缺失机制以及缺失模式,不同协方差矩阵结构的MMRM以及多重填补不同次数后协方差分析所得效应估计值与真实值之间仍最接近,且前者较后者更为稳定。而单一填补方式以及模式混合模型(PMM)随着缺失比例增加,其效应估计的误差也增加,尤其是单调缺失,当缺失比例为10%~15%时其误差最大。结论:不同缺失比例(0%~5%、5%~10%、10%~15%),缺失模式(单调缺失或任意缺失)以及缺失机制(完全随机缺失或随机缺失)下,MMRM误差最小,提示MMRM是处理双臂优效性临床试验中纵向定量数据缺失的首选方案。  相似文献   

6.
目的 应用多重填补法合并广义估计方程评估高血糖危险因素。 方法 利用多重填补法合并广义估计方程分别处理苏州市相城区第三人民医院老年人2011-2015年(2013年除外)健康管理档案中相关信息的数据缺失和重复测量问题,综合评估高血糖的危险因素。 结果 8 325位老年人累计23 195条观测记录中,纳入的指标除性别、年龄为完整变量,其余变量缺失率范围为0.06%~18.44%,样本实际有效率为76.99%,数据资料呈任意缺失模式。多重填补后,产生10个完整的不同数据集,所有变量填补效率都在0.97以上。高血糖危险因素OR值(95% CI)评估结果:高血压1.272(1.201~1.361)、超重1.251(1.162~1.341)、肥胖1.649(1.481~1.852)、心率过快1.679(1.581~1.792)、高胆固醇血症1.178(1.060~1.311)、混合型高脂血症1.170(1.021~1.332)、低密度脂蛋白胆固醇1.112(1.040~1.171)、高尿酸血症1.172(1.089~1.271)、丙氨酸氨基转移酶偏高1.180(1.032~1.351)、天冬氨酸氨基转移酶偏高1.191(1.032~1.391)。缺失填补前后,混合型高脂血症和天冬氨酸氨基转移酶偏高的统计学意义发生改变。γ和r值表明缺失对体质指数的参数估计影响最大。 结论 多重填补法合并广义估计方程能有效解决高血糖危险因素评估时遇到的数据缺失和重复测量问题,公共卫生部门应加强监测可能引起高血糖患病的相关因素,针对高危老年人做好健康指导工作。   相似文献   

7.
目的:解决世界健康调查(World Health Survey,WHS)数据中的数据缺失问题,进行更加有效的统计推断.方法:根据多重填补(multiple imputation,MI)的原理,运用Amelia软件和Stata○R中的综合统计推断程序对WHS数据集进行处理.结果:由缺失数据造成的信息缺失得到了弥补,综合评价结果的质量得到了提高.结论:MI具有良好的特性,和针对特定问题但操作复杂的方法相比,MI是一种解决数据缺失问题的简单和近似的方法.  相似文献   

8.
目的:数据缺失在调查研究中是一个非常普遍的现象,它的出现造成部分原始样本信息的损失,在一定程度上危害研究结果的有效性,需要引起研究者的重视。缺失数据产生的3类机制为完全随机缺失、随机缺失、非随机缺失。目前常见的缺失数据处理方法包括删除法、加权调整法、插补法、参数似然法,其各有优缺点,应针对缺失数据产生的机制选择相应的处理方法。  相似文献   

9.
目的 探讨弥漫性冠状动脉病变内膜剥脱术后心肌梗死(MI)发生的危险因素。方法 选择2017年1月至2022年6月邯郸市第一医院住院治疗弥漫性冠状动脉病变患者140例,均在内膜剥脱术后再行冠状动脉旁路移植术(CABG)治疗;根据术后7 d内是否发生MI分为MI组(n=39)和无MI组(n=101)。比较两组临床资料,采用logistic回归模型评价内膜剥脱术后MI发生的危险因素,采用受试者工作特征(ROC)曲线分析相关独立危险因素用于内膜剥脱术后MI发生风险预测临床效能,并进一步分析临床特征指标与左心室射血分数间关系。结果 140例患者术后7 d内发生MI共39例,发生率为27.86%;MI组基线左心室射血分数(LVEF)水平为(56.31±6.82)%,低于非MI组,MI组术后心肌肌钙蛋白I水平为(2.27±0.44)μg/L,高于非MI组,差异均有统计学意义(P<0.05);多因素logistic回归分析显示,入院时LVEF和术后24小时心肌肌钙蛋白I是内膜剥脱术后MI发生的独立影响因素(P<0.05);ROC曲线分析结果显示,入院时LVEF用于内膜剥脱术后MI发生风险预...  相似文献   

10.
目的探讨常用的基因表达谱数据缺失值填充方法对于提高目前流行的基因表达谱数据分类器一支持向量机性能的影响。方法采用公开发表的酵母菌基因表达谱数据.及Ribo功能类作为类属性构成训练集。分别利用KNN法和类均值法对其缺失值进行填充后.基于完整的表达谱数据对SVMs模型进行训练。采用k折交叉验证法避免训练中的过拟合问题,绘制CV准确率等高线图监控模型参数的迭代。采用检验对所得模型的性能进行评价。结果KNN法填充下。SVMs模型的CV准确率维持在99.554%;类均值法填充下,SVMs模型的CV准确率从99、554%上升至99.635%。对于模型性能的统计学愉验显示.两者差异无统计学意义。结论根据模型性能的统计学检验结果,两种填充方法对于SVMs模型性能改善的差别没有统计学意义。研究者可以根据实验条件和基因表达谱数据的特点任意选取两种填充方法进行处理。  相似文献   

11.
Adenovirus infection in intussusception in children in Taiwan   总被引:2,自引:0,他引:2  
E J Clarke  I A Phillips  E R Alexander 《JAMA》1969,208(9):1671-1674
  相似文献   

12.
小儿耳鼻喉手术麻醉的新进展   总被引:2,自引:0,他引:2  
吴莉  解雅英 《内蒙古医学杂志》2006,38(12):1158-1160
因小儿耳鼻喉手术刺激强,时间短,且常与气道相关,故麻醉的控制有一定难度,现对国内外现阶段小儿耳鼻喉手术麻醉的改良方法及新观点进行评述,以期对临床工作有较好的指导意义。  相似文献   

13.
随着国内外生命科学和生物技术等的飞速发展,我国医药技术在2001年取得了长足的进步。提前完成了我国所承担的人类基因组汁划中的1%测序任务,到2000年,中国科学家在功能基因研究和基因组多样性领域共完成研究论文1850篇,遍及医药各领域,研究手段和水平可于国际先进水平媲美,中国完全有条件在“后基因时代”成为主角之一。  相似文献   

14.
为探讨成都市不同级别医疗机构儿童支气管肺炎单病种费用水平以及不同收费项目占总费用的比例特点及控制医疗费用的有效途径,为患者自主选择就诊医疗机构提供参考指导,对成都市卫生局所属不同级别医院儿童支气管肺炎住院医疗费用分析如下。1资料与方法1.1资料来自成都市卫生局2  相似文献   

15.
16.
Thirty-two children with malaria were admitted to Dudley Road Hospital, Birmingham, in the 1970s. None was admitted before 1974 and there was a rapid increase after that. All the infections were due to Plasmodium vivax and occurred in children of Asian immigrant families who had been born in or had visited India or Pakistan apart from one infant born in England who acquired the disease transplacentally. All presented within 12 months of entering or re-entering the United Kingdom. The clinical features of the 32 patients have been analysed and it is suggested that more effort should be made to educate travellers about the need for anti-malarial chemoprophylaxis and the necessity to continue it for one month after return.  相似文献   

17.
2005年广西流动人口疟疾监测结果分析   总被引:2,自引:0,他引:2  
目的了解广西流动人员疟疾流行现状,进而提出针对性防治措施。方法收集全区网络直报疫情资料和各级疾病预防控制机构疟疾监测数据进行分析。结果2005年广西流动人口发热病人平均疟原虫阳性率为0·33%。80·62%的病人为本地居民外出到疟疾流行区务工感染所致。以从事护林/砍伐比例最高,占44·19%。结论加强返乡流动人口疟疾监测是巩固广西疟疾防治的关键所在。  相似文献   

18.
19.
20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号