摘 要: | 目的:通过构建的特征加权方法筛选出最佳特征子集,构建创伤性颅脑损伤输血机器学习预测模型。方法:通过对临床输血多维数据的异常值与缺失值处理、特征方差与相关性系数计算、特征评分归一化与特征分数加权相加和基于相关性的特征选择(CFS),建立单病种输血大数据的特征加权选择方法,并筛选出最佳特征子集,采用XGBoost算法模型验证特征子集的应用性能。结果:本研究建立了创伤性颅脑损伤输血大数据的特征加权选择方法,通过对医院3 579例颅脑创伤患者临床输血大数据纳入的46个特征进行筛选,最终纳入16个特征作为最佳特征子集。XGBoost算法模型预测结果显示特征加权选择的特征子集构建的模型的准确率、ROC曲线下面积、召回率和F1值均高于卡方算法、随机森林和逻辑回归特征选择。结论:特征加权选择方法可有效提取临床输血多维数据中的重要特征,可提升临床输血模型预测准确性,为构建输血预测机器学习模型和人工智能开发提供支持。
|