摘 要: | 目的利用随机森林算法与Logistic回归模型,建立脊柱结核的预测模型。方法选取250例脊柱结核患者和250例非脊柱结核患者,收集17项临床指标。利用随机森林算法对纳入指标的重要程度排序,根据滑动窗口序贯向前选择法找出合适的变量个数;将变量纳入二元Logistic回归模型,分析与脊柱结核发病相关的指标;采用混淆矩阵评价所建立模型的预测效能。结果重要性位列前10的指标为低白蛋白、脊柱后凸、血沉、椎旁或腰大肌脓肿、贫血、骨质破坏、C反应蛋白、盗汗、活动受限、体重下降。Logistic回归分析显示,白蛋白降低、脊柱后凸、血沉升高、椎旁或腰大肌脓肿、贫血、骨质破坏、C反应蛋白升高、体重下降均与脊柱结核有关(均P<0.05)。所建立的模型对脊柱结核患者预测的正确率为94.0%,模型预测的总准确度达93.4%。结论基于随机森林算法的Logistic回归模型预测脊柱结核具有较高的准确度。如患者存在血沉、C反应蛋白、白蛋白异常,以及脊柱后凸、脊柱破坏、椎旁或腰大肌脓肿,应高度警惕脊柱结核的可能。
|