摘 要: | 目的:通过加权基因共表达网络分析筛选结直肠癌(Colorectal cancer,CRC)潜在的生物标志物.方法:下载基因表达综合数据库(Gene expression omnibus,GEO)中的基因表达谱GSE44076 和GSE21815,使用R语言软件limma包和sva包筛选出CRC组和正常对照组中的差异表达基因(Differentially expressed genes,DEGs).采用加权基因共表达网络分析方法(Weighted gene co-expression network analysis,WGCNA)确定关联最强的基因模块.将模块中的基因与DEGs取交集,得到差异共表达基因.采用Metascape在线工具对差异共表达基因进行富集分析;在String数据库中构建蛋白-蛋白互作网络(Protein-protein interaction,PPI),导入Cytoscape软件中使用度值(Degree)方法筛选前 10 个连接度高的基因作为关键基因.在GEPIA数据库中对关键基因进行差异表达和生存分析验证.采用受试者操作特性(Receiver operating characteristic curve,ROC)曲线评估关键基因诊断价值.采用RT-qPCR检测关键基因在结直肠癌组织和癌旁组织中的表达水平.结果:GSE44076 和GSE21815 合并后的数据集共筛选 925 个DEGs,基于WGCNA获取关键模块基因 110 个,两者取交集共筛选出 86 个差异共表达基因.GO富集分析提示差异共表达基因主要富集于细胞核染色质、核基质、有丝分裂细胞周期过程、胞质分裂、染色体结构 DNA 代谢过程及调节和 DNA 复制等过程.KEGG 通路富集分析筛选出 BUB1、CDK1、TOP2A、NUF2、CEP55、MAD2L1、TPX2、AURKA、UBE2C、KIF4A共 10 个关键基因.经GEPIA数据库分析结果显示,关键基因在结直肠癌中都高表达,并且BUB1、MAD2L1 和AURKA与结直肠癌预后相关;CDK1 和MAD2L1 与临床分期相关,并且 ROC 曲线显示 CDK1 和 MAD2L1 具有良好的诊断效能.RT-qPCR 结果显示,MAD2L1、CDK1、BUB1 和AURKA在结直肠癌组织中显著上调.结论:关键基因MAD2L1、CDK1、BUB1 和AURKA参与结直肠癌的发生发展,可作为结直肠癌潜在的生物标志物.
|