基于不完整数据的IHB-LightGBM心脏病预测模型 |
| |
作者姓名: | 赵小强1 2 3 乔慧1 |
| |
作者单位: | 1.兰州理工大学电气工程与信息工程学院, 甘肃 兰州 730050; 2.兰州理工大学甘肃省工业过程先进控制重点实验室, 甘肃 兰州 730050; 3.兰州理工大学国家级电气与控制工程实验教学中心, 甘肃 兰州 730050 |
| |
基金项目: | 国家重点研发计划(2020YFB1713600);;国家自然科学基金(61763029); |
| |
摘 要: | 提出基于不完整数据的IHB-LightGBM(Improved Hyperband-Light Gradient Boosting Machine)心脏病预测模型。首先,在Hyperband算法超参数采样的基础上引入了权重值,并通过蓄水池法按特征权重对其进行排序,从而筛选出最优参数以提高算法的参数寻优能力;其次,针对心脏病数据样本小且属性缺失的问题,使用K近邻算法对不完整数据进行缺失值插补,再将处理得到的完整数据进行归一化,使数据映射至0~1范围内;最后,对LightGBM采用改进后的IHB优化算法进行全局参数寻优,建立IHB-LightGBM心脏病预测模型。使用UCI心脏病数据集进行实验,结果表明IHB算法的参数寻优效果优于贝叶斯、随机搜索等优化算法,IHB-LightGBM模型在各项评价指标也上明显高于随机森林、极端随机树等算法,可以获得更快的预测速度和更高的预测精度。
|
关 键 词: | 数据挖掘 心脏病预测 超参数优化算法 LightGBM算法 |
|
| 点击此处可从《中国医学物理学杂志》浏览原始摘要信息 |
|
点击此处可从《中国医学物理学杂志》下载免费的PDF全文 |