排序方式: 共有2条查询结果,搜索用时 15 毫秒
1
1.
2.
目的:比较不同的缺失值处理方法处理随机缺失数据的效果。方法:以HIV/AIDS血液样本血红蛋白、白细胞和血尿素氮检测数据为基础,利用SAS9.1,分别模拟完整数据集和不同缺失率的数据集,从精确度、准确度和分布三方面比较不同方法对缺失数据集的处理效果。结果:任意缺失比例下血红蛋白和白细胞数据经不同的方法处理后与完整数据集比较差异无统计学意义。不同缺失比例下,多重填补(MI)法的精确度最高。缺失率10%~20%时,MI法填充后的准确度最高。缺失率30%时,成组删除法处理后的准确度最高。缺失40%以上时,准确度填充效果不稳定。不同缺失比例下,回归法、成组删除法和MI填充2次后的数据的分布特征与完整数据集一致。结论:数据缺失10%~20%时,MI法填充效果最好;缺失30%时,成组删除法处理效果最好;缺失40%以上时,所有方法填充效果均不佳。 相似文献
1