摘 要: | 目的:利用转录组数据识别与结直肠癌(Colorectal Cancer,CRC)相关的功能模块与核心基因,为CRC的早期诊断和治疗提供线索。方法:从基因表达综合数据库(Gene Expression Omnibus,GEO)下载了4套与CRC相关的表达谱数据:GSE44076(98病例+50对照)、GSE21815(132病例+9对照)、GSE9348(70病例+12对照)、GSE8671(32病例+32对照),使用在线工具GEO2R分别筛选差异表达基因(Differentially Expressed Genes,DEGs)并取交集,以此作为种子基因,通过蛋白质-蛋白质互作(Protein-Protein Interaction,PPI)知识扩充构建CRC特异性基因网络。然后,应用Newman网络分解算法提取CRC的功能模块及其核心基因。最后,对CRC功能模块进行了基于京都基因与基因组大百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)的通路富集分析,探讨这些功能模块的生物学意义。结果:共筛选出412个上调DEGs和231个下调DEGs,作为种子基因,通过PPI扩展为一个包含2261节点的CRC特异性基因网络。利用Newman算法提取了15个功能模块并识别了87个核心基因,包括已知的与CRC相关的基因(例如COL1A2、CDK1、MYC等)和尚未有报道的基因(例如PRKCB、ACTN1、KAT2B等)。KEGG富集结果显示,CRC功能模块主要与细胞周期(hsa04110)、DNA复制(hsa03030)、Wnt信号通路(hsa04310)、PI3K-AKT信号通路(hsa04151)等通路有关。结论:本研究识别了15个CRC特异性功能模块和87个模块的核心基因,为进一步揭示CRC的发病机制、发掘有效生物标志物和治疗靶标提供参考。
|