首页 | 本学科首页   官方微博 | 高级检索  
     

基于加权随机森林的三阴性乳腺癌microRNA组学数据的分类预测
作者姓名:郭志飞  王碧珏  杨海涛  李治  王菊平  曹红艳  周立业
作者单位:1. 山西医科大学卫生管理学教研室;2. 山西医科大学社会医学教研室;3. 河北医科大学流行病与卫生统计学教研室;4. 中北大学体育学院;5. 山西医科大学卫生统计教研室;6. 重大疾病风险评估山西省重点实验室
基金项目:国家自然科学基金资助(71403156);;山西省回国留学人员科研资助(2017-054);;山西省应用基础研究计划(201901D111204);;河北省自然科学基金(H2019206558);
摘    要:目的基于microRNA组学数据,探讨加权随机森林在三阴性乳腺癌分类预测中的应用,为疾病诊断提供方法学支撑。方法以TCGA乳腺癌数据为例,采用加权随机森林构建三阴性乳腺癌的分类预测模型,并与随机森林、logistic回归、支持向量机、LASSO和岭回归五种模型进行比较。结果通过比较六种模型的5个评价指标,加权随机森林模型的预测性能明显优于其他五种模型,加权随机森林模型的灵敏度为0.852、特异度为0.873、准确度为0.871、AUC值为0.862和G-means值为0.861。结论加权随机森林构建的分类预测模型较好地识别了三阴性乳腺癌患者,可为三阴性乳腺癌的诊断提供方法学上的参考。

关 键 词:加权随机森林  分类预测  microRNA  三阴性乳腺癌
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号