首页 | 本学科首页   官方微博 | 高级检索  
检索        

应用机器学习和神经网络模型识别结直肠癌“炎癌转化”过程的关键基因及防治中药预测
引用本文:刘洋,曹赛雅,冯月娇,王杰,陈腾.应用机器学习和神经网络模型识别结直肠癌“炎癌转化”过程的关键基因及防治中药预测[J].中草药,2023,54(19):6386-6399.
作者姓名:刘洋  曹赛雅  冯月娇  王杰  陈腾
作者单位:上海中医药大学附属普陀医院(上海市普陀区中心医院) 普外科, 上海 200062;安徽医科大学普陀中心临床学院 普外科, 上海 200062
基金项目:国家自然科学基金面上项目(81973625);国家科技部重点研发计划(2019YFC1316000);上海市普陀区卫生健康系统临床特色专病建设项目(2019tszb01);上海市中医医院第三届中医传承人才项目(2023zycc02)
摘    要:目的 应用公共数据库挖掘结直肠癌“炎癌转化”过程的关键基因,结合机器学习和神经网络模型的算法优势进行基因筛选,验证关键基因作为预测指标的可行性及免疫相关性,进而预测潜在防治中药。方法 利用基因表达数据库(Gene Expression Omnibus,GEO)2个GSE66407和GSE166925数据集,筛选由正常结肠到炎症结肠(溃疡性结肠炎),最后进展到肠癌的过程中出现的差异基因;通过构建蛋白质-蛋白质相互作用网络(protein-protein interaction,PPI)进一步筛选核心基因;运用梯度提升机、随机森林和决策树3种分类机器学习算法进行结局的预测学习,将3种机器学习算法筛选出的核心基因取交集,构建深度学习框架下的人工神经网络模型,对模型预测准确性进行内部及外部验证;实时定量聚合酶链反应(real-time quantitative polymerase chain reaction,RT-PCR)联合人蛋白质图谱数据库(Human Protein Atlas,HPA)的免疫组化数据分析关键基因在初发结直肠癌患者癌组织及正常组织中的表达;运用单样本基因集富集分析(single sample gene set enrichment analysis,ssGSEA)算法分析核心基因与免疫细胞之间的关联;通过生存分析筛选对结直肠癌具有预后意义的基因;最后通过核心基因进行相关中药的预测分析。结果 在结直肠炎癌转化全过程中,共鉴定出152个共同的差异基因。这些基因参与肿瘤免疫反应、炎症反应等生物过程;经由3种机器学习算法的筛选,最终确定了8个核心基因,包括组织金属蛋白酶抑制剂1(tissue inhibitor of metalloproteinases 1,TIMP1)、基质金属蛋白酶1(matrix metalloproteinase 1,MMP1)、趋化因子CXC配体13(C-X-C motif chemokine ligand 13,CXCL13)、普列克底物蛋白(Pleckstrin,PLEK)、颗粒酶B(granzyme B,GZMB)、CXCL5CXCL3CXCL8。在深度学习框架下的神经网络模型中,训练集中对正常组和肿瘤组的预测准确率分别为86.3%、92.3%;外部验证集中对正常组和肿瘤组的预测准确率分别为80.0%、80.6%。8个核心基因同时涉及多种免疫浸润过程;RT-PCR结合HPA数据库分析显示TIMP1MMP1GZMBCXCL5CXCL8CXCL3在结直肠癌患者癌组织中表达显著升高(P<0.05),CXCL13在癌组织中表达显著降低(P<0.05),PLEK在癌组织中表达降低但差异不显著;TIMP1CXCL13CXCL8对患者的整体生存具有显著影响。对实验验证有显著差异的7个核心基因进行防治中药预测分析,结果显示预测中药以清热药和补虚药为主,四气以寒、温和平性为主,五味以苦、辛、甘味比例最大。结论 TIMP1MMP1CXCL13GZMBCXCL5CXCL3CXCL8可以作为预测结直肠癌“炎-癌”转化过程的关键分子,对这些分子进行中药的早期干预,可能对结直肠癌的早期诊疗具有重要意义。

关 键 词:炎癌转化  结直肠癌  机器学习  神经网络模型  免疫浸润  清热药  补虚药
收稿时间:2023/7/12 0:00:00
点击此处可从《中草药》浏览原始摘要信息
点击此处可从《中草药》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号