首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 19 毫秒
1.
急性白血病的基因表达谱分析与亚型分类特征的鉴别   总被引:7,自引:0,他引:7  
本研究基于生物信息学理论,运用模式识别方法和计算技术,对急性白血病的基因表达谱数据进行分析,研究急性白血病的亚型识别与分类信息基因选取问题。首先去除无关基因,然后利用浮动顺序搜索算法搜索特征空间生成候选特征子集,最后以支持向量机作为分类器进行急性白血病的亚型识别,并以误识率为依据鉴别出了5个包含完整分类信息的基因。实验结果表明,本研究鉴别出的5个信息基因能以100%的正确率准确识别急性白血病亚型。  相似文献   

2.
为了提高肿瘤病理诊断的准确性和效率,本研究提出基于信息熵和粗糙集理论的信息筛选及其人工神经网络的灵敏度分析方法,并用于选取肿瘤特征基因。通过粗糙集和信息熵对基因的筛选模型,建立必要的基因集;通过基因对BP神经网络模型输出函数的灵敏度分析,递归去除灵敏度较低的若干基因,生成一组候选特征基因子集;将特征基因子集传输到肿瘤病理诊断系统,生成诊断报告。该方法具有很高的可行性和有效性。  相似文献   

3.
相关向量机在肿瘤表达谱分类问题中的应用   总被引:1,自引:0,他引:1  
基因芯片技术能够检测大量基因的表达水平,在肿瘤研究中得到日益广泛的应用。基于基因芯片表达谱的肿瘤分类诊断是肿瘤表达谱研究的一个热点,肿瘤表达谱分类是一个典型的高维度小样本分类问题,描述一个两步策略的分类方法。在测试的基因表达谱中存在大量的非差异表达冗余基因,通过一个有效的基因预选择策略得到一个较小的候选基因子集,然后建立基于相关向量机的分类预测模型。在4个真实的肿瘤表达谱数据上,与几种不同的方法进行比较,结果显示该方法可以得到更好的分类精度,同时表现出很好的稳定性。  相似文献   

4.
乳腺癌基因数据的分类研究在临床医学上具有重要意义。针对基因数据的结构复杂、高维小样本等特点,提出一种最大相关最小条件冗余和深度级联森林结合的基因数据分类方法。选取博德基因研究所乳腺癌基因表达数据集,共98个数据作为样本,每个样本包含1 213个特征基因。首先对数据进行标准化处理,然后利用最大相关最小条件冗余选取特征子集,最后使用深度级联森林对特征子集进行分类。将随机森林、支持向量机和BP神经网络作为对比方法。结果表明,所提出的最大相关最小条件冗余和深度级联森林结合方法的最佳分类准确率达到93.78%,明显优于其他方法。该方法能有效提高乳腺癌基因数据的分类准确率,对基于基因数据的乳腺癌分类具有重要的理论意义与实用价值。  相似文献   

5.
目的寻找与肿瘤相关的基因诊疗中差异表达基因提取的方法。方法将基因表达谱数据进行预处理,采用相对风险方法筛选出差异表达基因特征子集,计算其样本间距离,然后对特征基因加权排序和过滤冗余基因,最后应用分类器对卵巢癌基因数据集进行分析,测试该方法的有效性。结果选取20维特征基因,进行分类测试,当特征基因为3~5、7和12~20维时,分类准确率可以达到100%,假阳性率可以达到0,表现出较好的可靠性,能够有效地将2个样本类型分开。结论经分类器测试证明,分类精度高,效果优于使用传统的基因差异表达分析方法。  相似文献   

6.
目的基于分子生物学的微阵列基因表达数据和智能优化算法对白血病肿瘤样本进行分类研究。方法给出基于粒子群优化(PSO)算法用于分类模型的训练和测试,选取含7129个基因的72个白血病基因表达样本,从中选取包含50、100和200个特征基因的3组数据,在不同基因数条件下分别执行10次分类测试。建立基于K-均值算法的分类模型,在同等条件下验证PSO算法分类性能。使用准确率、精确率、召回率、F1值等机器学习指标及Boxplot和Heatmap图谱用于分析对比。结果PSO算法用于分类测试的数据分别含20例急性淋巴细胞白血病(ALL)和14例急性髓细胞白血病(AML)样本。10次分类结果的平均分类准确率均在90%左右;PSO算法的分类准确率并不稳定,10次分类测试中,准确率的平均值和最优值间存在明显差异;ALL亚型的召回率明显高于AML亚型,均接近100%,但AML亚型的精确率明显高于ALL亚型,均接近100%,F1值可比性不大。K-均值算法与PSO算法类似,分类性能随着基因数的增加而降低;K-均值算法在200基因数条件下分类结果较差,分类稳定性和准确率均出现大幅下降,且低于同等条件下PSO算法分类结果;100个基因数条件下,ALL亚型召回率为100%,高于AML亚型;AML亚型精确率为100%,高于ALL亚型;200个基因数条件下,平均值中ALL亚型召回率和F1值高于AML亚型,AML亚型精确率高于ALL亚型,其最优值的统计学指标差异不大。相同白血病肿瘤样本的不同特征基因数条件下,PSO算法可获得较高准确率的分类结果,但分类稳定性不足,整体上优于K-均值算法。结论PSO算法能够应用于白血病基因表达样本的分类研究。  相似文献   

7.
挖掘特征基因是分析基因表达谱的一项基础工作,但众多的特征基因挖掘方法所挖掘的特征基因集合并不完全一致。本研究试图从生物功能和样本分类能力两个方面,分析比较不同方法所挖掘的特征基因的功能一致性,并对RankGene中的八种不同特征基因挖掘方法以及基于八种方法的集成法进行了功能一致性分析。结果显示:无论是生物功能分析还是样本分类能力分析,二分规则、Gini指数、方差总和三种方法的一致性较高;样本分类能力分析中,各方法所挖掘的特征基因对样本的分类准确率均较高,但不能明确区分方法间样本分类能力的优劣。  相似文献   

8.
四种模式分类方法应用于基因表达谱分析的比较研究   总被引:1,自引:0,他引:1  
利用基因表达谱数据借助于模式分类的方法识别癌症等疾病的类型及不同亚型是DNA芯片技术的一个应用方面。在这篇文章中,我们研究比较了在不同的特征基因选择方法的情况下,Fisher线性判别,Logit非线性判别,最小距离和K-最近邻四种模式分类方法对疾病分型效能的影响及四种模式分类方法的泛化能力,同时研究了在样本构成变化的情况下,模式分类方法的稳定性。结果发现:运用t检验法和分类树选择的特征基因,明显优于随机选择的基因在四种不同的分类器中分类效果;四种分类器中,K最近邻分类器的分类效能最优;基于最小距离的分类器和K最近邻分类器有较强的泛化能力;四种模式分类对样本构成的变化呈较好的稳定性。  相似文献   

9.
基于肿瘤基因表达数据,利用信息科学的方法和技术建立肿瘤预测分类模型,对肿瘤基因表达模式研究和肿瘤的诊断识别具有重要意义.本研究提出一种从肿瘤基因表达数据中直接挖掘分类规则建立肿瘤预测分类器的方法.该方法首先抽取实验样本集,分别找出标记肿瘤和正常组织样本的分类特征,由此生成可预测样本类别的分类规则,对每个未知类别样本,按照置信度最高原则,选择一个分类规则作为预测结构.本研究的实验数据来自Broad Institute的前列腺癌基因表达数据,实验结果显示该方法的预测精度在90%以上,且同时获得了大量结构透明的分类预测规则,表明本研究的方法是可行的和有效的.  相似文献   

10.
背景:氧化应激与椎间盘退变的发生发展息息相关,但其发病机制和有效治疗方法仍不明确。目的:运用生物信息学及3种机器学习算法识别与椎间盘退变伴氧化应激相关的关键基因及免疫浸润分析,并进行实验验证。方法:从GEO数据库获得椎间盘退变基因表达谱以及从GeneCards数据库获得氧化应激相关基因,对椎间盘退变数据集进行差异分析及加权基因共表达网络(WGCNA)分析,两者取交集并与氧化应激相关基因取交集得到候选hub基因,对候选hub基因进行GO和KEGG分析;运用机器学习(LASSO回归、SVM-RFE及随机森林)筛选最佳特征基因并进行受试者特征曲线验证,同时行相关免疫浸润分析。收集2023年7-11月就诊于山西医科大学第二医院的颈椎病患者的椎间盘样本作为椎间盘退变组,颈椎脊髓损伤患者的椎间盘样本作为对照组,采用qPCR方法验证特征基因在椎间盘退变组织中的相对表达量。结果与结论:(1)经过差异基因分析获取424个差异表达基因,WGCNA分析得到5 087个基因,同时获得氧化应激基因1 399个,进而得到23个候选hub基因;(2)GO分析结果显示,主要参与细菌防御反应、细菌来源分子反应等生物过程...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号