基于机器学习算法筛选胰腺癌诊断标志物及药物敏感性分析 |
| |
引用本文: | 齐荣暄,胡超扬,李渊,穆俊芳,王灿,薛丹阳,纪之琳,葛川,贺培凤,于琦.基于机器学习算法筛选胰腺癌诊断标志物及药物敏感性分析[J].现代消化及介入诊疗,2023(5):644-648. |
| |
作者姓名: | 齐荣暄 胡超扬 李渊 穆俊芳 王灿 薛丹阳 纪之琳 葛川 贺培凤 于琦 |
| |
作者单位: | 1. 山西医科大学管理学院;2. 山西省临床决策研究大数据重点实验室;3. 山西医科大学基础医学院;4. 山西医科大学公共卫生学院 |
| |
摘 要: | 目的 通过生物信息学方法和机器学习算法挖掘基因表达综合数据库(Gene Expression Omnibus, GEO)中胰腺癌的关键表达基因,探究胰腺癌的诊断标志物。方法 以GEO数据库获得的芯片数据集GSE15471、GSE16515作为训练组,GSE28735作为验证组,用于筛选出差异表达基因(Differentially Expressed Genes, DEGs)。利用套索算法(Least absolute shrinkage and selection operator, Lasso)与支持向量机的递归特征消除算法(Support Vector Machines with Recursive Feature Elimination, SVM-RFE)从DEGs中筛选出胰腺癌的关键表达基因,并在验证组中进行验证。采用受试者工作特征(Receiver Operating Characteristic, ROC)曲线的曲线下面积(Area Under Curve, AUC)评价关键表达基因的诊断效能。使用Kaplan-Meier生存曲线对关键表达基因进行预后生存分析。通过Cell...
|
关 键 词: | 胰腺癌 机器学习 诊断标志物 药物敏感性 |
|
|