首页 | 本学科首页   官方微博 | 高级检索  
检索        

基于重采样和Voting异质集成的分类模型在肝硬化并发肝性脑病风险预测中的探索性研究北大核心CSCD
引用本文:王旭春,翟梦梦,任浩,李美晨,全帝臣,张岩波,刘近春,仇丽霞.基于重采样和Voting异质集成的分类模型在肝硬化并发肝性脑病风险预测中的探索性研究北大核心CSCD[J].中国卫生统计,2022(4):545-549.
作者姓名:王旭春  翟梦梦  任浩  李美晨  全帝臣  张岩波  刘近春  仇丽霞
作者单位:1.山西医科大学卫生统计教研室030001;2.山西医科大学第一医院消化内科;
基金项目:国家自然科学基金资助项目(81973155);山西省重点研发计划项目(201803D31066)。
摘    要:目的针对肝硬化并发肝性脑病风险预测的因素具有高维性、冗余性及类间不均衡的特征,研究变量筛选后的重采样和Voting异质集成分类模型的风险预测性能。方法收集2006年1月-2015年12月某三甲医院消化内科肝硬化住院患者950例,68例并发肝性脑病,采用logistic逐步回归进行风险预报因子初筛;再采用SMOTE重采样技术及其改进算法处理不平衡数据;最后采用SVM、MLP、随机森林以及综合以上三种算法预测结果的Voting异质集成分类算法构建肝硬化并发肝性脑病的风险预测模型。结果logistic回归筛选了7个风险预报因子,采用重采样技术后的分类模型的预测性能整体上优于不平衡数据模型,以SVM-SMOTE最优;相同重采样技术后的Voting异质集成与随机森林分类模型的预测性能优于SVM和MLP,其中Voting异质集成分类模型的性能略高于随机森林。综合各模型性能可知,采用SVM-SMOTE重采样技术处理的Voting异质集成模型在识别肝硬化并发肝性脑病的效果最好,测试集各评价指标值分别为:AUC=0.947、准确率=0.877、精确度=0.898、召回率=0.855、F1分数=0.876。结论针对肝硬化并发肝性脑病风险预测因素的高维性、冗余性及类间不均衡的特征,本文所提出的基于logistic逐步回归特征筛选、SVM-SMOTE重采样的Voting异质集成模型的预测效果较为满意。

关 键 词:肝性脑病  不平衡数据  重采样  集成学习  分类预测
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号