首页 | 本学科首页   官方微博 | 高级检索  
检索        

机器学习算法在肝细胞癌微血管侵犯术前预测中的应用价值
引用本文:刘红枝,林海涛,林昭旺,傅俊,丁宗仁,郭鹏飞,刘景丰.机器学习算法在肝细胞癌微血管侵犯术前预测中的应用价值[J].中华消化外科杂志,2020(2):156-165.
作者姓名:刘红枝  林海涛  林昭旺  傅俊  丁宗仁  郭鹏飞  刘景丰
作者单位:福建医科大学孟超肝胆医院东南肝胆健康大数据研究所福建省肝胆医学中心
基金项目:福建省发展和改革委员会专项基金(31010308)。
摘    要:目的探讨机器学习算法在肝细胞癌微血管侵犯(MVI)术前预测中的应用价值。方法采用回顾性描述性研究方法。收集2015年5月至2018年12月福建医科大学孟超肝胆医院收治的277例肝细胞癌患者的临床病理资料;男235例,女42例;年龄为(56±10)岁,年龄范围为33~80岁。患者术前均行磁共振成像检查。227例肝细胞癌患者通过计算机产生随机数方法以7∶3比例分为训练集193例和验证集84例。应用逻辑回归列线图,支持向量机(SVM)、随机森林(RF)、人工神经网络(ANN)和轻量级梯度提升机(LightGBM)机器学习算法构建MVI术前预测模型。观察指标:(1)训练集及验证集患者临床病理资料分析。(2)影响训练集患者肿瘤MVI危险因素分析。(3)机器学习算法预测模型构建及其术前预测肿瘤MVI准确性比较。正态分布的计量资料以±s表示,组间比较采用配对t检验。计数资料以绝对数表示,组间比较采用χ2检验。单因素和多因素分析采用Logistic回归模型。结果(1)训练集及验证集患者临床病理资料分析:训练集和验证集患者性别(男,女)分别为157、36例和78、6例,两组比较,差异有统计学意义(χ2=6.028,P<0.05)。(2)影响训练集患者肿瘤MVI危险因素分析:训练集193例患者中,MVI阳性108例,MVI阴性85例。单因素分析结果显示:年龄、肿瘤数目、肿瘤直径、卫星病灶、肿瘤边界、甲胎蛋白(AFP)、碱性磷酸酶(ALP)和纤维蛋白原水平是影响肿瘤MVI的相关因素(比值比=0.971,2.449,1.368,4.050,2.956,4.083,2.532,1.996,95%可信区间为0.943~1.000,1.169~5.130,1.180~1.585,1.316~12.465,1.310~6.670,2.214~7.532,1.016~6.311,1.323~3.012,P<0.05)。多因素分析结果显示:AFP>20μg/L、肿瘤多发、肿瘤直径越大、肿瘤边界不光滑是影响肿瘤MVI的独立危险因素(比值比=3.680,3.100,1.438,3.628,95%可信区间为1.842~7.351,1.334~7.203,1.201~1.721,1.438~9.150,P<0.05),而年龄越大,MVI发生风险越低(比值比=0.958,95%可信区间为0.923~0.994,P<0.05)。(3)机器学习算法预测模型构建及其术前预测肿瘤MVI准确性比较:①应用多因素分析结果筛选指标,包括年龄、AFP、肿瘤数目、肿瘤直径、肿瘤边界,构建逻辑回归列线图,SVM、RF、ANN及LightGBM机器学习算法预测模型,一致性分析结果显示逻辑回归列线图预测模型稳定性较好。逻辑回归列线图、SVM、RF、ANN、LightGBM机器学习算法预测模型训练集和验证集曲线下面积(AUC)分别为0.812、0.794、0.807、0.814、0.810和0.784、0.793、0.783、0.803、0.815,SVM、RF、ANN、LightGBM机器学习算法AUC分别与逻辑回归列线图AUC比较,差异均无统计学意义(95%可信区间为0.731~0.849,0.744~0.860,0.752~0.867,0.747~0.862,Z=0.995,0.245,0.130,0.102,P>0.05)和(95%可信区间为0.690~0.873,0.679~0.865,0.702~0.882,0.715~0.891,Z=0.325,0.026,0.744,0.803,P>0.05)]。②应用RF、LightGBM机器学习算法自行筛选临床病理因素指标构建预测模型。根据指标对预测模型重要度排序,选择重要度>0.01的指标,包括年龄、肿瘤直径、AFP、白细胞(WBC)、血小板、总胆红素、天冬氨酸氨基转移酶、γ-谷氨酰转移酶、ALP和纤维蛋白原,构建RF机器学习算法预测模型;挑选重要度>5.0的指标,包括年龄、肿瘤直径、AFP、WBC、ALP和纤维蛋白原,构建LightGBM机器学习算法预测模型;由于ANN及SVM机器学习算法不具备筛选指标能力,应用单因素分析结果筛选指标,包括年龄、肿瘤数目、肿瘤直径、卫星病灶、肿瘤边界、AFP、ALP和纤维蛋白原水平,构建SVM、ANN机器学习算法预测模型。SVM、RF、ANN、LightGBM机器学习算法预测模型训练集和验证集AUC分别为0.803、0.838、0.793、0.847和0.810、0.802、0.802、0.836,分别与逻辑回归列线图AUC比较,差异均无统计学意义(95%可信区间为0.740~0.857,0.779~0.887,0.729~0.848,0.789~0.895,Z=0.421,0.119,0.689,1.517,P>0.05)和(95%可信区间为0.710~0.888,0.700~0.881,0.701~0.881,0.740~0.908,Z=0.856,0.458,0.532,1.306,P>0.05)]。结论机器学习算法可用于术前预测肝细胞癌MVI,但其应用价值尚需多中心大样本数据进一步验证。

关 键 词:肝肿瘤  微血管侵犯  预测  机器学习  轻量级梯度提升机

Application value of machine learning algorithms for preoperative prediction of microvascular invasion in hepatocellular carcinoma
Liu Hongzhi,Lin Haitao,Lin Zhaowang,Fu Jun,Ding Zongren,Guo Pengfei,Liu Jingfeng.Application value of machine learning algorithms for preoperative prediction of microvascular invasion in hepatocellular carcinoma[J].Chinese Journal of Digestive Surgery,2020(2):156-165.
Authors:Liu Hongzhi  Lin Haitao  Lin Zhaowang  Fu Jun  Ding Zongren  Guo Pengfei  Liu Jingfeng
Institution:(Southeast Big Data Institute of Hepatobiliary Health,Mengchao Hepatobiliary Hospital of Fujian Medical University,Hepatobiliary Medical Center of Fujian,Fouzhou 350025,China)
Abstract:
Keywords:Hepatic neoplasms  Microvascular invasion  Prediction  Machine learning  LightGBM
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号