利用机器学习算法分析影响阿尔兹海默病的脂蛋白及代谢物 |
| |
引用本文: | 王凤琳,王爱民,黄一铭,徐雅琪,张文婧,石福艳,王素珍.利用机器学习算法分析影响阿尔兹海默病的脂蛋白及代谢物[J].现代预防医学,2023(23):4225-4230. |
| |
作者姓名: | 王凤琳 王爱民 黄一铭 徐雅琪 张文婧 石福艳 王素珍 |
| |
作者单位: | 潍坊医学院公共卫生学院 |
| |
基金项目: | 国家自然科学基金(81803337,81872719,82003560);;山东省自然科学基金(ZR2019MH034,ZR2020MH340); |
| |
摘 要: | 目的 基于机器学习算法探讨阿尔兹海默病发病的脂蛋白及代谢物影响因素。方法 从ADNI数据库中选取2012年诊断结果为正常(cognitive normal,CN)和阿尔兹海默病(Alzheimer disease,AD)的研究对象共314例,收集其脂蛋白及代谢物数据。采用随机森林、lasso回归、XGboost算法三种方法对变量进行重要性排序及筛选。利用三种方法筛选出的变量,结合研究人群的性别、年龄、婚姻状况构建随机森林模型,预测影响AD发病的重要因素。结果 三种方法共筛选出12个脂蛋白及代谢物变量,结合研究人群的年龄、性别、婚姻状况共15个变量被纳入随机森林模型。模型的准确率为84.13%、灵敏度为93.75%、特异度为53.33%、Kappa值为0.518 3、AUC(95%CI)为0.735(0.600~0.871)。根据随机森林模型中Mean Decrease Accuracy和Mean Decrease Gini两指标分别筛选出的排名前五的变量中均包含以下四个变量:大极低密度脂蛋白中的磷脂与总脂质之比(L_VLDL_PL_PCT)、年龄(AGE)、乳糜微粒和极大极低密度脂蛋白...
|
关 键 词: | 阿尔兹海默病 随机森林 Lasso回归 XGboost算法 |
|
|