摘 要: | 目的探讨利用常规检验数据建立肺结核疾病鉴别诊断模型的应用价值。方法采用回顾性调查研究方法, 收集2015年5月至2021年11月就诊于北京积水潭医院和北京和平里医院初诊为肺结核和其他肺部疾病患者的常规检验数据。共纳入11 516例患者数据, 通过计算机产生随机数方法以9∶1比例分为训练集和测试集。使用支持向量机、随机森林、K最近邻和逻辑回归4种机器学习算法进行模型测试和特征选择, 采用十折交叉验证法验证模型诊断准确度, 并采用受试者工作特征(ROC)曲线下面积(AUC)评价模型诊断效能。结果本研究选择随机森林作为最优机器学习算法构建肺结核鉴别诊断的最佳特征模型。通过模型特征重要性排序, 选择37个非特异性检验项目构成肺结核鉴别诊断模型, 其验证集和测试集曲线下面积分别为0.747和0.736, 敏感度为68.03%和68.75%, 特异度为70.91%和67.90%, 准确度为70.30%和68.12%。结论基于机器学习算法利用常规检测数据是肺结核疾病鉴别诊断的一个有效工具, 但其应用价值还有待于更多医疗机构数据做进一步验证。
|